seo - Googlebot がマーケティング URL をインデックスに登録しようとしているかどうかを気にする必要がありますか?

Question

最近、Google Webmaster Toolsを使い始めました。

Google がインデックスに登録しようとしているリンクの数を見て、私は非常に驚きました。

http://www.example.com/?c=123
http://www.example.com/?c=82
http://www.example.com/?c=234
http://www.example.com/?c=991

これらはすべて、パートナーサイトからのリンクとして存在するキャンペーンです。

現時点では、サイトが完成するまで、ロボットファイルによってすべて拒否されています。これは、サイトのすべてのページと同様です。

robots.txt ファイルの制限を緩和する前に、このようなリンクに対処するための最善の方法は何だろうと考えています。

それらが別の URL として扱われ、Google の検索結果に表示されるようになるのではないかと心配しています。それらはすべて同じページに対応しています-ギブまたはテイク。人々がそれらをそのまま見つけてクリックしてほしくありません。

これまでの最良のアイデアは、次のようにクエリ文字列を含むページをレンダリングすることです。

 // DO NOT TRY THIS AT HOME. See edit below
 <% if (Request.QueryString != "") { %>

    <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

 <% } %>

これを行う必要がありますか? これは最善のアプローチですか？

編集：これは良いアプローチではないことが判明しました。Google は、NOINDEX を持たない別のページと同じコンテンツを持つページで NOINDEX を見ていることがわかりました。どうやらそれらは同じものであり、NOINDEXが優先されます。その結果、私のサイトは Google から完全に姿を消しました。警告: それは私が同時に行った何かだったかもしれませんが、私はこのアプローチを危険にさらすつもりはありません.

score 4 · Accepted Answer

これは、そのrel="canonical"ために設計されたものです。Google はそれに関するブログ記事を投稿しました。

score 1 · Accepted Answer

はい、Google はそれらを異なる URL として解釈します。

ウェブサーバーによっては、書き換えフィルターを使用して検索エンジンのパラメーターを削除できます。たとえば、Tomcat のURL 書き換えフィルターやApache のmod 書き換えなどです。

個人的には、トラッキングパラメータを削除して同じページにリダイレクトするだけです。

score 0 · Accepted Answer

インデックスを作成するべきではないリソースについては、ページの読み込みで単純な戻りを行うことを好みます。

if (IsBot(Request.UserAgent)
    return;

score 0 · Accepted Answer

ページが独自のフォルダーに存在しない限り、これが最善のアプローチのようです。その場合、そのフォルダーを無視するように robots.txt ファイルを変更できます。

seo - Googlebot がマーケティング URL をインデックスに登録しようとしているかどうかを気にする必要がありますか?

4 に答える 4

Related

Reference