背景: 私の Web サイトでは、登録ユーザーが動画をアップロードして共有することができます。
メインページには「ユーザー名」と「パスワード」欄があり、登録ユーザーは必要に応じてログインできます。
また、各ビデオ ページには、ビットレートとフラッシュ プレーヤーを選択するためのテキスト リンクがあります。
(両方の例については、 http ://videoflier.com/およびhttp://videoflier.com/movies/1360488842878341996730を参照してください。)
または、Google で「site:videoflier.com」を検索して、私が話していることを確認してください。
私の問題: Googleまたは検索エンジンがインデックスを作成すると、もちろん、ログインテキストとビデオビットレートを設定するためのリンクが表示されます(「 190 234 [698] 1247 kbps | osflv [jwplayer] flowplayer 」のようになります)
(Google で「site:videoflier.com」を検索して例を確認してください。)
次のようになります。
段ボール飛行機 videoflier.com/movies/1352509017371554759177 段ボール飛行機 osflv jwplayer [flowplayer] ダンボールとテープで作った飛行機の模型です。リモコンが装備されていた...
(ビットレートとプレーヤーの選択が見苦しく、スペースを浪費していることに注意してください。)
これまでのところ、きれいに整頓された方法で解決しようとする私の試み (そして、なぜ私はそれらのどれも好きではないのですか。)
テキストの代わりに画像を使用する:サイトを高速かつ効率的にしたいので、必要がなければテキストに画像を使用したくありません。
設定用の別のページを用意する:サイトを高速で使いやすいものにしたいと考えています。
robots.txt:検索エンジンがページを読み取れなければ、ページを見つける方法がわかりません!
CGI を使用して検索ボットから情報を隠すこれは私が思いついた最良のアイデアについてですが、私は汚いハックをしたくありません。Google 自身もいくつかの異なるユーザー エージェント文字列を使用していますが、実際には「ロボット」という単語を含むものはありません。ほとんどに「Googlebot」が含まれていますが、すべてではありません。そして、他の検索エンジンが何を使用しているのか誰にもわかりません。
もちろん、彼らが通常の Web ブラウザのように見えるエージェント文字列を使用する理由は理解できます (Google もこれを主張しています)。
しかし、可能性のあるすべての検索エンジンを特定するために、絶えず変化するブラックリストを本質的に実行する必要はありません。電子メールのスパムとの戦いのように聞こえます。さらに、検索結果が読みやすくなるように、ログイン リストとビットレート リストを非表示にしようとしています。
javascript: Javascript には独自の問題があります (ブラウザの互換性の問題、アクセシビリティなど)。仕事に最適なツールである場合は Javascript を使用しますが、できる限り純粋でクリーンな HTML が大好きです。
理想的な世界では: <NOBOT>ユーザー名: パスワード:</NOBOT> のような HTML タグがあればいいのにと思いますが、私の知る限り、何も存在しません。理想的には、この架空のタグにより、検索エンジンが非表示のアイテムに基づいて結果を返さないようにすることもできます。「パスワード」という単語を Google に入力する人は、間違いなく私のサイトを見つけようとしているわけではありません。
schema.org? HTML の範囲内でデータの型を指定できるので、最初は schema.org に期待していました。残念ながら、私が知る限り、そのカテゴリとものはすべて次のようなものです。「無視」または「管理オブジェクト」オプションがないようです。
検索エンジンが作成者、説明、およびタイトル テキストをどこから取得するかを既に知っているように、他のすべてに schema.org を広範囲に使用することが、おそらくより大雑把な答えになるでしょう。
どうもありがとうございました、
ジェシー・ゴードン