11

ページの一部を無視し、残りをインデックスに登録するように、Google へのディレクティブを微調整することは可能ですか?

私たちが遭遇したいくつかの異なる問題があり、これによって助けられるでしょう:

  • 外部ソースからのコンテンツを表示するページ上の RSS フィード/ニュース ティッカー タイプのテキスト
  • 連絡先の電話番号などの詳細を入力するユーザー。サイトに表示されることを希望するが、Google 対応は望まない

上記の両方が他の手法 (JavaScript を使用してコンテンツを作成するなど) で解決できることは承知していますが、Google からよりクリーンなオプションが既に提供されているかどうかを知っている人はいますか?

googleon私はこれについて掘り下げていて、とgoogleoffタグの言及に出くわしましたが、これらは Google 検索アプライアンス専用のようです。

Googlebot が準拠する同様のタグのセットがあるかどうか、誰か知っていますか?

編集:明確にするために、私はGoogleにさまざまなコンテンツをクローキング/提供するという危険な道をたどりたくありません.ここで行う。

4

8 に答える 8

10

あなたが求めていることは、実際にはできません.Googleはページ全体を取得するか、まったく取得しません.

ページのインデックスを作成したくない部分を iFrame に挿入し、robots.txt を使用してその iFrame をインデックスに登録しないように Google に依頼するなど、いくつかの卑劣なトリックを実行できます。

于 2009-09-30T11:17:25.030 に答える
1

公式ドキュメントはこちらからご覧ください

http://code.google.com/apis/searchappliance/documentation/46/admin_crawl/Preparing.html

「不要なテキストを索引から除外する」セクションに移動します。

<!--googleoff: index-->
here will be skipped
<!--googleon: index-->
于 2011-12-23T12:35:52.920 に答える
1

つまり、クローキングを使用しない限り、Google は推奨していません。

于 2009-09-30T11:08:08.310 に答える
-1

はい、間違いなく、カスタム robots.txt を作成することで、Google がウェブサイトの一部をインデックスに登録するのを停止し、wpadmins のようにインデックスを作成したくない部分、または特定の投稿やページを記述して、このロボットを作成することで簡単にインデックスを作成できるようにすることができます。 txt ファイル .作成する前に、www.yoursite.com/robots.txt などのサイト robots.txt を確認してください。

于 2014-01-31T06:45:06.290 に答える
-1

サーバーで、PHP または ASP を使用して IP で検索ボットを検出します。次に、そのリストに該当する IP アドレスに、インデックスを作成するページのバージョンをフィードします。ページの検索エンジンに適したバージョンでは、canonical リンク タグを使用して、インデックスに登録したくないページ バージョンを検索エンジンに指定します。

このようにして、インデックスを作成したいコンテンツを含むページはアドレスのみでインデックス作成され、インデックスを作成したいコンテンツのみがインデックス作成されます。この方法は、検索エンジンによってブロックされることはなく、完全に安全です。

于 2009-09-30T11:16:56.840 に答える
-2

ボット用のメタタグがあり、特定のディレクトリへのアクセスを制限できる robots.txt もあります。

于 2009-09-30T11:08:53.940 に答える
-2

すべての検索エンジンは、ページ全体をインデックス化するか無視します。必要なものを実装する唯一の方法は次のとおりです。

(a) 同じページの 2 つの異なるバージョンがある

(b) 使用されているブラウザを検出する

(c) 検索エンジンの場合は、ページの 2 番目のバージョンを提供します。

このリンクは役に立つかもしれません。

于 2009-09-30T11:09:55.297 に答える