“googlebot”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

115 参照

web - monodoc.ashx とは何ですか? googlebot がそれを要求するのはなぜですか?

たくさんのリクエストをいただいています。それらはすべてで始まります

次に、.NET クラスのように見えるものが続きます。これらは何ですか?なぜ googlebot はそれらを要求するのですか?

アクセスログとエラーログが汚染されないように、オフにする必要があります。

web googlebot

user34537

2011-09-30T08:33:26.530

0 投票する

2 に答える

475 参照

asp.net - Googlebot は .aspx ページにアクセスしています。SEO に適した URL のみにアクセスする必要があります

Googlebot が.aspx私のウェブサイトのページにアクセスしています。例: http://mysite.com/thepage.apx?id=32

私は SEO に適した URL に Intelgencia URL モジュールを使用しました。私の Web サイトには、わかりやすい URL (または拡張子のない URL) を表示するリンクもあります (例: http://mysite.com/thepage/32 ) 。

ただし、googlebot は元の URL (http://mysite.com/thepage.apx?id=32) にアクセスしています。

robot.txt ファイルに、次のコードを配置しました。

許可しない: *.aspx

私の質問は、.aspxページとフレンドリ URL (同じページを指す) を持つすべてのページを非表示にするか、拡張機能.aspxだけでページを非表示にするかです。.aspx

概要:
Googlebot は 2 つの URL で同じページにアクセスしています:

somesite/thepage.aspx?id=xx などの元のパスを使用
フレンドリ URL somesite/somepage/xx を使用して、googlebot にフレンドリ URL のみにアクセスさせたい。私はasp.net 2.0を使用しており、わかりやすいURLはweb.configintellgencia dllを使用してマップされています。

Intelgencia モジュールを使用して web.config にコードを記述します。

2011-10-11T18:54:23.817

0 投票する

2 に答える

1485 参照

php - Google ボットが最後にページにアクセスした時刻を取得するにはどうすればよいですか?

Googlebot の最終アクセス日を取得する次の関数があります。

しかし、このスクリプトは、結果として画面内のページ全体のスナップショットを出力します。ページ全体がGoogleにキャッシュされましたが、単語の後の日時のみをキャプチャしas it appeared onて印刷したい8 Oct 2011 14:03:12 GMT.

方法？

php googlebot

2011-10-14T09:45:28.510

0 投票する

2 に答える

303 参照

php - URL パラメータに基づいて Google ボットのアクセスを制限する

たとえば、次のリンクがあります。

の場合、Google ボットへのアクセスを許可したくありません。それを無効にすることは可能ですかview。oddsdetails私はJoomlaフレームワークを使用しているので、すでにrobots.txtがあります。可能であればそれを拡張したいと考えています。

php joomla search-engine robots.txt googlebot

2011-10-20T08:37:08.837

0 投票する

2 に答える

1386 参照

php - googlebotを識別するための最良の方法

Googlebotクローラーを識別するための最も信頼性が高く最速の方法は何ですか？rDNSはスプーフィングされる可能性があるため、googlebotのIPリストが最も信頼できる方法のようです。実際のgooglebotipsを取得できるサイト/リソースはありますか？他のアイデアは歓迎します。

php googlebot identify

2011-10-25T10:15:23.787

0 投票する

2 に答える

1172 参照

indexing - Googlebot は HTML コメントのリンクをインデックスに登録していますか?

Google ウェブマスターツールで膨大な数の NOT FOUND リンクを取得しました。リンクは、HTML コメントに挿入されたフッターのコードセクションから来ているようです。

すべてのページに NOARCHIVE タグがあるため、おそらくキャッシュの問題ではありません

これは誰かに起こりましたか？

indexing googlebot

2011-11-02T08:51:17.353

0 投票する

1 に答える

304 参照

iphone - iPhone と Googlebot が混在するユーザーエージェント

私のサイトでは、この「奇妙な」ユーザーエージェントが表示されます。

Mozilla/5.0+(iPhone;+U;+CPU+iPhone+OS+4_1+like+Mac+OS+X;+en-us)+AppleWebKit/532.9+(KHTML,+like+Gecko)+Version/4.0. 5+Mobile/8B117+Safari/6531.22.7+(互換;+Googlebot-Mobile/2.1;++http://www.google.com/bot.html)

それが iPhone なのか Google Bot なのか知っていますか?

iphone user-agent googlebot

2011-11-09T10:47:47.767

0 投票する

4 に答える

1086 参照

php - Googleを除外するPHPコード.

私は広告のウェブサイトを持っています。このウェブサイトでは、ユーザーが履歴の目的で訪問した各製品ページをデータベースに保存しているため、最後に訪問した製品を表示できます。

問題は、Googlebot や他のユーザーが私のサイトにアクセスすると、Google がアクセスする何千もの製品ページを傷つけるため、DB が何千ものエントリでいっぱいになることです。

現在のユーザーがgooglebotであるかどうかを調べるためにさまざまな機能$_SERVER['HTTP_USER_AGENT']を試してみました。そうであれば、dbのページビューを痛めないようにして、役に立たない結果でスパムされないようにしましたが、どれも機能していないようです。 Google の IP を取得し、データベースで認識します。

グーグルを確実に排除するためのPHPの良い方法を知っている人はいますか?

php googlebot

2011-11-23T14:20:57.093

0 投票する

0 に答える

380 参照

.htaccess - mod_rewrite を使用した SEO に適した URL は、結果に SEO に適したものにしようとしているファイルを示します

Google seo のために、mod の書き換えを正しく行うのに問題があります。

www.example.com/p/press goto internal ./pages/press.html

ただし、Google はリンクを www.example.com/p/press として表示する必要があります。

それは可能ですか？または、Google は URL を www.example.com/pages/press.html として表示しますか?

他のすべてのリンクとブラウザは www.example2.com に移動する必要があります

別の時間にページが pages/press.html でヒットしたと仮定すると、それは下のルールに一致し、そこにリダイレクトされます。mod_alias などを使用して /p/press 呼び出しで初めてコンテンツを表示する方法はありますか?

.htaccess mod-rewrite googlebot

2011-11-30T14:04:55.017

問題タブ [googlebot]

Reference