問題タブ [googlebot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
561 参照

localization - Cookies 検索エンジンを使用したローカリゼーションは互換性がありますか?

ウェブサイトのローカライズを行っています。私は、Cookie を優先言語に設定してから、それぞれの言語を表示する方法に行きました。また、Cookie が設定されていない場合は、ユーザーのブラウザによって設定された優先言語ヘッダーが使用されます。ヘッダーが設定されていない場合は、デフォルトで英語になります。

では、Google のボットはどのように機能するのでしょうか。Web サイトの各バージョンを取得できるように、ヘッダーに異なる言語を設定して、すべての Web サイトを 1 回ずつクロールしますか? それとも、ヘッダーを設定しますか? そうでない場合は、URL ベースの言語セレクタ (www.domain.com/en/page.html www.domain.com/fr/page.html) を使用するように、これらすべてを再構築する必要がありますか。

0 投票する
2 に答える
4169 参照

seo - SEO:グーグルボットは隠されたdivのテキストを見ますか

私のサイトには、デフォルトで非表示のdivにあるログイン/サインアップポップアップがあります。グーグルSEOと隠された要素によると、グーグルボットはそれを見るべきではありません。

しかし、グーグルのウェブマスターツールは、キーワード「メール」と「パスワード」がサイトのトップキーワードであると言っています。

なぜそうなのですか?なぜグーグルボットはそれらを見るのですか?

トップキーワードの関連性について心配する必要がありますか?

0 投票する
3 に答える
200 参照

javascript - JS 動的 img 変更と SEO

jquery を使用してコンテンツ間の移行をうまく行う Web サイトを作成しました。

コードは次のように機能します。2 つの img (本文とフッター) があります。

(別のページに移動する代わりに) リンクをクリックすると、2 つの画像がフェードアウトし、2 つの src 属性が変更されます。新しい画像が読み込まれると、それらをフェードインします。

SWFaddressユーザーが内部コンテンツに直接アクセスできるようにするために使用しています。

ここで、Google やその他の検索エンジンによってコンテンツをインデックス化したいと考えています。すべてのテキスト コンテンツは imgs 内にあるため、テキストは ALT 属性に含まれています。

私の質問は:

JS を使用して imgs ALT 属性を動的に変更すると、スパイダーはそれを適切に読み取ることができますか?

SWFaddressサイトマップの作成に使用していると考えてください。

0 投票する
3 に答える
6868 参照

seo - ユーザーフレンドリーなコンテンツをユーザーに提供しながら、グーグルに適切な404を返す方法は?

私はこれをここに投稿することとスーパーユーザーに投稿することの間を行き来しています。これがここに属していないように感じたら失礼します。

私はここで説明されている動作を観察しています-Googlebotは私のサイトでまたはのようなランダムなURLを要求していaecgeqfx.htmlますsutwjemebk.html。私は自分のサイトのどこからでもこれらのURLをリンクしていないと確信しています。

リンクされた質問への回答から引用するために、これは存在しないコンテンツをどのように処理するかをグーグルが調査しているのではないかと思います。

存在しないコンテンツ用のカスタムページがあります。「コンテンツが見つかりません。誤ってここにアクセスしたと思われる場合は、お問い合わせください」というスタイルのページと、(当然のことながら)。が付いた内部リンクがいくつかあります200 OK。URLは直接提供されます(単一のURLへのリダイレクトはありません)。

これがグーグルのサイトを差別するかもしれないのではないかと思います-彼らはユーザーフレンドリーなページをとして解釈せず、404 - not found私たちが何かを偽造して重複コンテンツを提供しようとしていると思うかもしれません。

ユーザーが誤ってデッドリンクをクリックした場合にユーザーフレンドリーなメッセージをユーザーに提供しながら、グーグルがサイトが偽物であると見なさないようにするにはどうすればよいですか?

0 投票する
2 に答える
575 参照

coldfusion - 私のColdFusionページが検索エンジンに空白のページを返すのはなぜですか?

私はASP.NETとPHPの開発をたくさん行ってきましたが、CFでこの種のことを追跡する方法についてはあまり詳しくありません。私の素朴な最初の迎え角は、ソースコードのいずれかでGoogleへの参照を検索することでした。運がない。

IIS7でサイトを実行しています。Google、Bing、Yahooはすべて、私のサイトでは何も「見えない」ようです。

更新:FetchをGooglebotとして実行し、次の情報を取得しました。

0 投票する
6 に答える
269 参照

dns - Googlebotはどこからクロールを開始しますか?

ドメインを登録して、それを完全なWebサイトに発展させたとしましょう。Googlebotはどこから、どのようにして新しいドメインが稼働していることを認識しますか?それは常にドメインレジストリから始まりますか?

レジストリで始まる場合、それは誰でもレジストリのデータベースに完全にアクセスできることを意味しますか?洞察をありがとう。

0 投票する
2 に答える
180 参照

authentication - 匿名ユーザーのサポートと Google ボットの比較

Web アプリに、現在ログインしているユーザーを表すクラスがありUserます。ユーザーがページにアクセスするたびにUser、Cookie で提供された認証データに基づいてインスタンスが作成されます。

User匿名ユーザーがログインしてもインスタンスが作成され、対応する新しいレコードがデータベースのテーブルに作成されますUser

このアプローチにより、タイプに関係なく、現在のユーザーの状態情報を保存できます。

ただし、このアプローチの問題は、Google ボットと、人間以外の Web 生物が私のページをクロールすることです。ボットがサイトを歩き回るたびに、何千もの役に立たないレコードがデータベースに作成され、それぞれが 1 つのページにのみ使用されます。

質問: 最良のトレードオフは何ですか? 匿名ユーザーをサポートし、その状態を保存し、Cookie を使用しないボットによるオーバーヘッドを回避するにはどうすればよいですか?

0 投票する
5 に答える
4827 参照

php - Googlebot の確認

大規模な検索エンジンを除くすべてのボットをブロックします。私のブロック方法の 1 つは、「言語」をチェックすることです: Accept-Language: If it has no Accept-Language ボットの IP アドレスは 2037 年までブロックされます.調べる

を使用しても大丈夫ですgethostbyaddrか、誰かが私の「gethostbyaddr保護」を通過できますか?

0 投票する
10 に答える
23192 参照

html - ロボットに特定のテキストを無視させる方法はありますか?

私は自分のブログを持っています (必要に応じて私のプロフィールから見ることができます)、それは新鮮であり、Google ロボットの解析結果も同様です。

結果は私にとって驚くべきものでした。どうやら私のサイトで最も一般的な 2 つの単語は「rss」と「feed」です。これは、「コメント RSS」、「投稿フィード」などのリンクにテキストを使用しているためです。これらの 2 つの単語はすべての投稿に表示されますが、他の単語はより希少になります。

これらのリンクを Google の解析から消す方法はありますか? テクニカル リンクをインデックスに登録したくありません。コンテンツ、タイトル、説明のみをインデックスに登録したい。このテキストを画像に置き換える以外の何かを探しています。

2007 年にさかのぼる古い議論を Google で見つけました (3 年後には多くのことが変わっていたと思います。できればこれもそうです)。

この質問は、robots.txt と、Google がページを無視するようにする方法に関するものではありません。ページの小さな部分を無視するか、人間には見えてロボットには見えないように部分を変換します。

0 投票する
2 に答える
219 参照

search - インデックスに登録されていないファイル (?) がまだ Google にある

私のページ /admin/login.asp が、クエリ "inurl:admin/login.asp" で Google に表示されるのに、"site:www.domain.xx" クエリでは表示されない可能性はありますか?

robots.txt に次のコード行があります。

そして、これはページの HTML コードで:

何か案は?