4

「biscru」または「Ticru」という特定の検索用語について、非常に多くの検索が記録されています (過去 2 か月で 63,000 回)。apache ログは、これらのリクエストが Google サーバーからのものであると示していますが、これは信じがたいことであり、IP アドレスがスプーフィングされているのではないかと疑っています。

Apache ログの例:-

rawliving.eu:66.249.72.227 - - [06/Jul/2013:01:25:09 +0100]
"GET /catalogsearch/result/index/?cat=47&dir=desc&limit=25&mode=list&order=event_date&p=6
&q=%22biscru%22+OR+%22Ticru%22
HTTP/1.1" 200 20587 "-" "Mozilla/5.0 (compatible; Googlebot/2.1;
+http://www.google.com/bot.html)"

66.249.72.227 をブロックすることは有効な Google アドレスであるため、明らかにオプションではありません。この歪みを防ぐために必要なオプションを提案し、これらのリクエストがどこから来て、その理由を特定できるでしょうか?

どんなアドバイスもありがたく受け取った。リー

4

1 に答える 1

3

これを layout-xml 定義に追加します (例: local.xml)

<catalogsearch_result_index translate="label">
        <reference name="head">
            <action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action>
        </reference>
    </catalogsearch_result_index>
    <catalogsearch_advanced_index translate="label">
        <reference name="head">
            <action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action>
        </reference>
    </catalogsearch_advanced_index>
    <catalogsearch_advanced_result translate="label">
        <reference name="head">
            <action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action>
        </reference>
    </catalogsearch_advanced_result>

数日経っても問題が解決しないかどうかを確認するか、robots.txt ファイルを使用して、catalogsearch の URL がインデックスに登録されないようにブロックします。

于 2013-07-06T10:58:52.547 に答える