1

私はGoogleAdSenseボットのアルゴリズムとWebサイトでの動作に興味があります。私はAdSenseを使用していませんでした、そして私はアカウントを持っていません。だから私はあなたの助けが必要です:

1)Gbotは、Webサイトからすべてのページをダウンロードすることがあります。私は正しいですか?

2)Gbotは動的コンテンツ(ajaxによってロードされる)を理解しません。したがって、静的コンテンツを生成してhtmlページ内に返す必要があり、このページにはすべてのユーザーとGbotに対して同一のコンテンツが表示される必要がありますか?

3)(1)と(2)のため、 「メイン」ウィジェットでルートパスhttp://example.comのみを使用することはできません。たとえばhttp://example.com/thread?id=101?などの一意のページを生成する必要があります。

4)Gbotはページ(1)をダウンロードしてキーワードを取得(インデックス作成)し、これらの情報をたとえばキー/値(キーはページパス、値はタグクラウド)ごとに(サーバーに)保存します。私は正しいですか?

5)ユーザーがブラウザでウェブサイトを開いたとき。統合されたhtmlAdSenseのコードはいくつかのJavaScriptをロードします。私が「グーグル」で理解しているように、このJavaScriptはページのインデックスを作成しませんが、(いくつかのパラメーターkey == page_pathを使用して)Googleのサーバーを呼び出し、適切な広告リンクを取得します。次に、この広告リンクをフレームに表示します。それは正しい行動ですか?たぶんJavaScriptはページのコンテンツのローカルインデックスを作成しますか?

6)GbotとAdSenseのJavaScriptはCookieとどのように連携しますか?私が理解しているように、AdSenseは適切な広告リンクを表示するためにCookieを使用できます。正しければ、いくつかのユースケースを教えてください;)

「真の」アルゴリズムは、Googleのエンジニアだけが知っていることを私は知っています。しかし、AdSenseとAdSense html/javascriptの経験がある人もいます。私のビジョンを修正してください;)

アドバイスありがとうございます!!!

PSこの質問は私にとって非常に重要です。それは楽しみのためのいくつかの質問ではありません!だから閉じないでください;)

4

1 に答える 1

3

1)Googlebotがページにアクセスでき、リンク、XMLSitemaps、Google+1などを介してページを認識している場合ははい。

2)Googlebotは、AJAXコンテンツを理解するためにAJAX / XHRリクエストを作成します(http://googlewebmastercentral.blogspot.com/2011/11/get-post-and-safely-sursurface-more-of.html)。

はい、ユーザーと同じコンテンツをGooglebotに表示する必要があります。そうしないと、クローキングと見なされ、ガイドラインに違反します。

3)この質問は明確ではありません。ただし、基本的にはURLを変更することをお勧めします。これは、Googleがコンテンツを個別にインデックス化する方法を知っているためです。AJAXを使用している場合は、提案したようなパーマリンクを検討するか、HTML5popstateを使用できます。

4)はいGoogleはページ上の単語にインデックスを付けます。キーと値のペアとして保存されているかどうかはわかりません。彼らがまだBigTable(http://labs.google.com/papers/bigtable.html)を使用しているかどうかさえわかりませんが、転置インデックスを保存するためにBigTableまたは同様のシステムを使用している可能性があります。

5)AdSenseコードは埋め込まれたJavascriptです... Googleがこれまでに見たことのない新しいWebページの場合、サイトに関するWebで見つかった情報に基づいて、またはリンクのアンカーテキストを介して、最も関連性の高い広告を配信しようとします。そのページに。ただし、ページのコンテンツをより正確に理解するために、GoogleはAdSense固有のボットを送信してページをクロールします...最初にページを読み込んだ直後でも、非常に高速に表示される場合があります時間。従来のGooglebotとは異なるユーザーエージェントを使用しています...ここでGoogleのすべてのユーザーエージェントを見つけることができます(http://www.google.com/support/webmasters/bin/answer.py?answer=1061943)

6)GoogleのクローラーはCookieを受け入れず、サーバーにCookieを返しません。これは、Cookieやセッションの維持を非常に困難にするGoogleクローラーの大規模な分散性と関係があります。

于 2011-11-04T06:01:06.723 に答える