1

私は個人名の大規模なディレクトリを、検索エンジンで可能な限り索引付けしたい、一般に公開されているカテゴリ固有の情報と一緒に持っています。これらの名前をサイト自体に掲載することは人々にとって問題ではありませんが、自分自身を「Google」したときに検索結果に表示されたくない人もいます.

これらの名前をページ内にリストし続け、ページをインデックスに登録したいのですが、検索エンジンで指定された名前やキーワードをインデックスに登録したくありません。

これはページごとに行うことができますか、それとも 2 つのページを設定する方が適切な回避策でしょうか:

利用可能なオプション:

  • user-agent=robot/search engine の場合、PHPはキーワードを検閲できます
  • ロボットを検閲されていないコンテンツに制限するためのhtaccess
  • 索引付けしない単語を定義するメタタグ?
  • JavaScriptはロボットからキーワードを非表示にすることができますが、それ以外の場合は表示可能です
4

3 に答える 3

1

私はオプションを見て、私が見ることができるいくつかの問題を教えてくれます:

PHP:信頼しても構わない場合は、user agentこれでうまくいきます。一部の検索エンジンが、ボットに表示されるさまざまなコンテンツにどのように反応するかはわかりません.

htaccess:おそらく、ボットを別のページにリダイレクトする必要があります。url パラメーターを使用することもできますが、これは純粋な PHP ソリューションを使用する場合と同じです。ボットは、アクセスしたいページではなく、リダイレクト先のページをインデックス化します。これを克服するために書き換えエンジンを使用できる場合があります。

メタ タグ:ボットに特定の単語を無視させるためにメタ タグを使用できたとしても、メタ タグには「標準」が設定されていないため、検索エンジンがそれを無視しないという保証はありません。しかし、メタ タグを使用してボットに特定の単語やフレーズを無視させる方法がないため、それは問題ではありません。

JavaScript:ページを見ているときに JavaScript を実行する (または読み取る) ボットは聞いたことがないので、これが機能しているとは思えません。JavaScript を使用して非表示にしたいコンテンツをユーザーに表示できます。ボットはそれを見ることができませんが、JavaScript を無効にしているユーザーも見ることができません。

私はPHPルートに行きます。

于 2009-11-27T05:23:02.233 に答える
0

ROBOTS metaを追加することで、特定のページのインデックス作成をスキップするようにロボットに指示できます。

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

更新:私が考えることができる特定の単語のインデックス作成を制限する方法は次のとおりです。

  1. JS を使用してそれらをページに追加します (以下を参照)。
  2. レンダリングされたページからそれらの単語を削除するモジュールをサーバーに追加します。

JavaScript は次のようになります。

<p>
  <span id="secretWord">
    <SCRIPT TYPE="text/javascript">
    <!-- 
       document.write('you can protect the word by concating strings/having HEX codes etc')
    //-->
    </script>
  </span>
</p>

サーバーモジュールはおそらく最良のオプションです。ASP.NET では、これを行うのは非常に簡単です。ただし、PHPについてはわかりません。

于 2009-11-27T05:14:04.370 に答える