問題タブ [googlebot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
localization - Cookies 検索エンジンを使用したローカリゼーションは互換性がありますか?
ウェブサイトのローカライズを行っています。私は、Cookie を優先言語に設定してから、それぞれの言語を表示する方法に行きました。また、Cookie が設定されていない場合は、ユーザーのブラウザによって設定された優先言語ヘッダーが使用されます。ヘッダーが設定されていない場合は、デフォルトで英語になります。
では、Google のボットはどのように機能するのでしょうか。Web サイトの各バージョンを取得できるように、ヘッダーに異なる言語を設定して、すべての Web サイトを 1 回ずつクロールしますか? それとも、ヘッダーを設定しますか? そうでない場合は、URL ベースの言語セレクタ (www.domain.com/en/page.html www.domain.com/fr/page.html) を使用するように、これらすべてを再構築する必要がありますか。
seo - SEO:グーグルボットは隠されたdivのテキストを見ますか
私のサイトには、デフォルトで非表示のdivにあるログイン/サインアップポップアップがあります。グーグルSEOと隠された要素によると、グーグルボットはそれを見るべきではありません。
しかし、グーグルのウェブマスターツールは、キーワード「メール」と「パスワード」がサイトのトップキーワードであると言っています。
なぜそうなのですか?なぜグーグルボットはそれらを見るのですか?
トップキーワードの関連性について心配する必要がありますか?
javascript - JS 動的 img 変更と SEO
jquery を使用してコンテンツ間の移行をうまく行う Web サイトを作成しました。
コードは次のように機能します。2 つの img (本文とフッター) があります。
(別のページに移動する代わりに) リンクをクリックすると、2 つの画像がフェードアウトし、2 つの src 属性が変更されます。新しい画像が読み込まれると、それらをフェードインします。
SWFaddress
ユーザーが内部コンテンツに直接アクセスできるようにするために使用しています。
ここで、Google やその他の検索エンジンによってコンテンツをインデックス化したいと考えています。すべてのテキスト コンテンツは imgs 内にあるため、テキストは ALT 属性に含まれています。
私の質問は:
JS を使用して imgs ALT 属性を動的に変更すると、スパイダーはそれを適切に読み取ることができますか?
SWFaddress
サイトマップの作成に使用していると考えてください。
seo - ユーザーフレンドリーなコンテンツをユーザーに提供しながら、グーグルに適切な404を返す方法は?
私はこれをここに投稿することとスーパーユーザーに投稿することの間を行き来しています。これがここに属していないように感じたら失礼します。
私はここで説明されている動作を観察しています-Googlebotは私のサイトでまたはのようなランダムなURLを要求していaecgeqfx.html
ますsutwjemebk.html
。私は自分のサイトのどこからでもこれらのURLをリンクしていないと確信しています。
リンクされた質問への回答から引用するために、これは存在しないコンテンツをどのように処理するかをグーグルが調査しているのではないかと思います。
存在しないコンテンツ用のカスタムページがあります。「コンテンツが見つかりません。誤ってここにアクセスしたと思われる場合は、お問い合わせください」というスタイルのページと、(当然のことながら)。が付いた内部リンクがいくつかあります200 OK
。URLは直接提供されます(単一のURLへのリダイレクトはありません)。
これがグーグルのサイトを差別するかもしれないのではないかと思います-彼らはユーザーフレンドリーなページをとして解釈せず、404 - not found
私たちが何かを偽造して重複コンテンツを提供しようとしていると思うかもしれません。
ユーザーが誤ってデッドリンクをクリックした場合にユーザーフレンドリーなメッセージをユーザーに提供しながら、グーグルがサイトが偽物であると見なさないようにするにはどうすればよいですか?
coldfusion - 私のColdFusionページが検索エンジンに空白のページを返すのはなぜですか?
私はASP.NETとPHPの開発をたくさん行ってきましたが、CFでこの種のことを追跡する方法についてはあまり詳しくありません。私の素朴な最初の迎え角は、ソースコードのいずれかでGoogleへの参照を検索することでした。運がない。
IIS7でサイトを実行しています。Google、Bing、Yahooはすべて、私のサイトでは何も「見えない」ようです。
更新:FetchをGooglebotとして実行し、次の情報を取得しました。
dns - Googlebotはどこからクロールを開始しますか?
ドメインを登録して、それを完全なWebサイトに発展させたとしましょう。Googlebotはどこから、どのようにして新しいドメインが稼働していることを認識しますか?それは常にドメインレジストリから始まりますか?
レジストリで始まる場合、それは誰でもレジストリのデータベースに完全にアクセスできることを意味しますか?洞察をありがとう。
authentication - 匿名ユーザーのサポートと Google ボットの比較
Web アプリに、現在ログインしているユーザーを表すクラスがありUser
ます。ユーザーがページにアクセスするたびにUser
、Cookie で提供された認証データに基づいてインスタンスが作成されます。
User
匿名ユーザーがログインしてもインスタンスが作成され、対応する新しいレコードがデータベースのテーブルに作成されますUser
。
このアプローチにより、タイプに関係なく、現在のユーザーの状態情報を保存できます。
ただし、このアプローチの問題は、Google ボットと、人間以外の Web 生物が私のページをクロールすることです。ボットがサイトを歩き回るたびに、何千もの役に立たないレコードがデータベースに作成され、それぞれが 1 つのページにのみ使用されます。
質問: 最良のトレードオフは何ですか? 匿名ユーザーをサポートし、その状態を保存し、Cookie を使用しないボットによるオーバーヘッドを回避するにはどうすればよいですか?
php - Googlebot の確認
大規模な検索エンジンを除くすべてのボットをブロックします。私のブロック方法の 1 つは、「言語」をチェックすることです: Accept-Language: If it has no Accept-Language ボットの IP アドレスは 2037 年までブロックされます.調べる
を使用しても大丈夫ですgethostbyaddr
か、誰かが私の「gethostbyaddr保護」を通過できますか?
html - ロボットに特定のテキストを無視させる方法はありますか?
私は自分のブログを持っています (必要に応じて私のプロフィールから見ることができます)、それは新鮮であり、Google ロボットの解析結果も同様です。
結果は私にとって驚くべきものでした。どうやら私のサイトで最も一般的な 2 つの単語は「rss」と「feed」です。これは、「コメント RSS」、「投稿フィード」などのリンクにテキストを使用しているためです。これらの 2 つの単語はすべての投稿に表示されますが、他の単語はより希少になります。
これらのリンクを Google の解析から消す方法はありますか? テクニカル リンクをインデックスに登録したくありません。コンテンツ、タイトル、説明のみをインデックスに登録したい。このテキストを画像に置き換える以外の何かを探しています。
2007 年にさかのぼる古い議論を Google で見つけました (3 年後には多くのことが変わっていたと思います。できればこれもそうです)。
この質問は、robots.txt と、Google がページを無視するようにする方法に関するものではありません。ページの小さな部分を無視するか、人間には見えてロボットには見えないように部分を変換します。
search - インデックスに登録されていないファイル (?) がまだ Google にある
私のページ /admin/login.asp が、クエリ "inurl:admin/login.asp" で Google に表示されるのに、"site:www.domain.xx" クエリでは表示されない可能性はありますか?
robots.txt に次のコード行があります。
そして、これはページの HTML コードで:
何か案は?