ページの特定の部分をインデックスに登録しないよう Google に伝えたいのですが。Yandex (ロシア SE) には、 という非常に便利なタグがあり<noindex>
ます。Google を使用してどのように行うことができますか?
4 に答える
ウィキペディア1によると、一部のクモが従ういくつかの規則があります。
<!--googleoff: all-->
This should not be indexed by Google. Though its main spider, Googlebot,
might ignore that hint.
<!--googleon: all-->
<div class="robots-nocontent">Yahoo bots won't index this.</div>
<noindex>Yandex bots ignore this text.</noindex>
<!--noindex-->They will ignore this, too.<!--/noindex-->
残念ながら、彼らは単一の基準に同意できなかったようです – そして私の知る限り、すべてのスパイダーを遠ざけるものは何もありません.
コメントはgoogleoff:
さまざまなオプションをサポートしているようですが、完全なリストがどこにあるかはわかりません。少なくともあります:
- all: ブロックを完全に無視する
- index: コンテンツは Google のインデックスに登録されません
- アンカー: リンクのアンカー テキストは、ターゲット ページに関連付けられません。
- snippet: 検索結果のスニペットの作成にテキストは使用されません
また、(少なくとも Google の場合) これは検索インデックスにのみ影響し、ページのランキングなどには影響しないことに注意してください。さらに、Stephen Ostermillerが以下のコメントで正しく指摘したように、Google 検索アプライアンスでのみ動作しgoogleon
、残念ながら、googleoff
通常の Googlebotです。
Yahoo パート2に関する記事もあります(および、Yandex も<noindex>
6を尊重していると説明する記事)。一方、この回答googleoff:
も参照してください。また、関連情報のほとんどを取得した記事も参照してください。3
さらに、Google ウェブマスター ツールでは、特定のリンク (ログイン/サインアップなど、ボットがアクセスできない/役に立たないページへの広告やリンクなど) にrel=nofollow
属性4を使用することをお勧めします。つまり、HTML の a rel 属性は Google ボットによって尊重される必要がありますが、これは主にページ ランクに関連しており、検索インデックス自体には関連していません。rel=noindex
残念ながら、 5,7はないようです。この属性が他の要素にも使用できるかどうかもわかりません (例: <DIV REL="noindex">
)。しかし、クローラーが「noindex」を尊重しない限り、それも意味がありません。
さらなる参考文献:
- Web ページの一部をインデックスに登録しない方法は?
- ページのセクションからクローラーを除外する(Spiderline クローラー。他のクローラーは他の独自のマーカーを使用する場合があります (AddSearch クローラーも参照)。DIV
REL="noindex"
/SPAN/P/あ!) - 文字列を逆にすることで、Google が div のコンテンツをインデックスに登録できないようにする
- 検索エンジンがページ上の無関係なコンテンツをインデックスに登録しないようにする方法
1 ウィキペディア: Noindex
2 Web ページのどのセクションが検索エンジンに無視される可能性があるか?
3 ページの特定の部分をインデックスに登録しないように Google に指示する
4 特定のリンクには rel="nofollow" を使用する
5 を使用するのは良い考え<a href=“http://name.com” rel=“noindex, nofollow”>name</a>
ですか?
6 HTML タグの使用 — Yandex.Help. Webmaster
7 の既存の REL 値
robots.txt によってブロックされている iframe にその部分を配置することで、Google がページの一部を表示できないようにすることができます。
robots.txt
Disallow: /iframes/
index.html
This text is crawlable, but now you'll see
text that search engines can't see:
<iframe src="/iframes/hidden.html" width="100%" height=300 scrolling=no>
/iframes/hidden.html
Search engines cannot see this text.
iframe を使用する代わりに、AJAX を使用して隠しファイルの内容を読み込むことができます。jquery ajax を使用してこれを行う例を次に示します。
his text is crawlable, but now you'll see
text that search engines can't see:
<div id="hidden"></div>
<script>
$.get(
"/iframes/hidden.html",
function(data){$('#hidden').html(data)},
);
</script>
いいえ、Google は<noindex>
タグをサポートしていません。事実上誰もしません。