1

最近、Google Webmaster Toolsを使い始めました。

Google がインデックスに登録しようとしているリンクの数を見て、私は非常に驚きました。

http://www.example.com/?c=123
http://www.example.com/?c=82
http://www.example.com/?c=234
http://www.example.com/?c=991

これらはすべて、パートナー サイトからのリンクとして存在するキャンペーンです。

現時点では、サイトが完成するまで、ロボット ファイルによってすべて拒否されています。これは、サイトのすべてのページと同様です。

robots.txt ファイルの制限を緩和する前に、このようなリンクに対処するための最善の方法は何だろうと考えています。

それらが別の URL として扱われ、Google の検索結果に表示されるようになるのではないかと心配しています。それらはすべて同じページに対応しています-ギブまたはテイク。人々がそれらをそのまま見つけてクリックしてほしくありません。

これまでの最良のアイデアは、次のようにクエリ文字列を含むページをレンダリングすることです。

 // DO NOT TRY THIS AT HOME. See edit below
 <% if (Request.QueryString != "") { %>

    <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

 <% } %>

これを行う必要がありますか? これは最善のアプローチですか?

編集:これは良いアプローチではないことが判明しました。Google は、NOINDEX を持たない別のページと同じコンテンツを持つページで NOINDEX を見ていることがわかりました。どうやらそれらは同じものであり、NOINDEXが優先されます。その結果、私のサイトは Google から完全に姿を消しました。警告: それは私が同時に行った何かだったかもしれませんが、私はこのアプローチを危険にさらすつもりはありません.

4

4 に答える 4

4

これは、そのrel="canonical"ために設計されたものです。Google はそれに関するブログ記事を投稿しました。

于 2009-05-02T10:00:06.120 に答える
1

はい、Google はそれらを異なる URL として解釈します。

ウェブサーバーによっては、書き換えフィルターを使用して検索エンジンのパラメーターを削除できます。たとえば、Tomcat のURL 書き換えフィルターやApache のmod 書き換えなどです。

個人的には、トラッキング パラメータを削除して同じページにリダイレクトするだけです。

于 2009-05-02T09:55:13.387 に答える
0

インデックスを作成するべきではないリソースについては、ページの読み込みで単純な戻りを行うことを好みます。

if (IsBot(Request.UserAgent)
    return;
于 2009-05-02T10:12:27.713 に答える
0

ページが独自のフォルダーに存在しない限り、これが最善のアプローチのようです。その場合、そのフォルダーを無視するように robots.txt ファイルを変更できます。

于 2009-05-02T09:54:19.147 に答える