スタイリングの目的で、ページにダミーのテキストを挿入したいのですが、実際のコンテンツにリンクされるべきではありません。検索エンジンに対してブロックする方法はありますか、それとも古き良き画像を使用する必要がありますか?
または、javascript を介して動的にロードすることは可能でしょうか? Google は一定量の JavaScript を読み取ると聞いたからです。
スタイリングの目的で、ページにダミーのテキストを挿入したいのですが、実際のコンテンツにリンクされるべきではありません。検索エンジンに対してブロックする方法はありますか、それとも古き良き画像を使用する必要がありますか?
または、javascript を介して動的にロードすることは可能でしょうか? Google は一定量の JavaScript を読み取ると聞いたからです。
そのテキストを AJAX 経由でロードすると、おそらくインデックスに登録されません。前回確認したところ、GoogleBot は実際には JS を実行しません (他のスパイダーも実行しません (ただし、一部のスパムボットは明らかに実行できます))。
警告: AJAX 応答には、X-Robots-Tag: noindex
その URL が実際にどこかにリンクされている場合に備えて、おそらくヘッダーが含まれているはずです。
ボーダレス iframe でコンテンツを表示し、検索エンジンから iframe の src (完全に別の「ページ」) をブロックできますか?
または、javascript を使用してコンテンツを追加し、エンジンからブロックする .js ファイルに javascript を保存しますか?
私はあなたが決めるどんなトリックにも非常に注意するでしょう。グーグルがあなたがそれとは異なるコンテンツをユーザーに表示しようとしていると考える可能性は同じです。
Googleは実際にページをレンダリングして(おそらくサーバー側バージョンのChromeレンダリングエンジンを使用して)動作し、その結果をOCRソフトウェアで読み戻して、ソース内のテキストがユーザーに表示されるものと一致することを確認すると常に信じていました。 JSとフレームが有効になっています。Googleは常にウェブマスターにロボットに異なるコンテンツをユーザーに提供しようとしないように公然と警告してきました。OCRはそれを見つけるのに最適な方法です(特に「検証者」がIEのユーザーエージェント文字列を使用し、Googleによって登録されていないIP範囲からクロールした場合)。
簡単な答えは、次のいずれかのように装飾を提供します。
ドキュメントをページに明確にリンクしているので、特に同じテキストがすべてのページに表示される場合、グーグルはそれを別のリソースと見なし、それに応じて評価します。それは私をもたらします:
すべて/ほとんどのページで同じテキスト装飾を使用しますか?もしそうなら、グーグルはほぼ確実にそれを「ウィンドウドレッシング」として扱い、それを無視します(それは明らかにメニューなどでこれを行います)。
ページの読み込みが完了した後 (たとえば、document.ready イベントが発生したとき) にコンテンツを読み込むことは、あなたが話していることを行うためのかなり安全な方法だと思います。ただし、これについて 100% 確信があるわけではありません。