2

私は自分のウェブサイト(GWT)をGoogleがクロールできるように設定しました。Googlewebmastertoolの「fetchasgoogle」ページを使用していると、次のパターンが表示されます。

  • 「http://www.mysite.com/#!AJAX_URL」へのアクセスは、スナップショットに正しくリダイレ​​クトされます
  • しかし、私がweb.xmlで設定したにもかかわらず、Googleは「http://www.mysite.com」のスナップショットを要求しません。

==>これに関連する2つの質問:

  • グーグルのウェブマスターツールは十分に賢くないが、実際のロボットはスナップショットを正しく要求するからだろうか
  • web.xmlまたは他の場所に何かを追加する必要がありますか?

ありがとう、

ヒューグ

4

2 に答える 2

4

たくさん調べてみたら、答えが見つかりました。メタタグをチェックせず、代わりに生のコンテンツを返すのは、FetchasGooglebotの機能です。Googleがページをクロールしてインデックスに登録すると、メタタグに気づき、それに応じて動作します。

答えへのリンクはここにあります(JohnMuのコメントを参照):

于 2012-09-04T10:05:17.810 に答える
0

'robots.txt'がクローラーアクセスを許可していることを確認してください。

User-agent: *
Allow: /

また、サイトマップをWebmasterToolsに送信することもできます。

スナップショットが正しく提供されているようです。念のため、動作中の「index.php」の関連部分を投稿します。静的ページは「static/${TOKEN}.html」にあります

<!doctype html>
<?php

function static_url ($token) { return 'static/' . $token . '.html'; }

$escaped_fragment = $_GET['_escaped_fragment_'];

if (isset($escaped_fragment)) {
  $fragment = preg_replace('/\//', '', $escaped_fragment);
  $file = static_url($fragment);

  if($escaped_fragment == '' || $escaped_fragment == '/'
      || (! file_exists($file))) {
    $fragment = '${DEFAULT_PLACE}:${DEFAULT_STATE}'; // your default place
    $file = static_url($fragment);
  }
  $re = '/(^<[^>]*>)|(\n|\r\n|\t|\s{2,4})*/';

  $handle = fopen($file, 'r');
  if ($handle != false) {
    $content = preg_replace($re, '', fread($handle, filesize($file)));
    fclose($handle);
  }
  else {
    $content = 'Page not found!';
    header(php_sapi_name() == 'cgi' ? 'Status: 404' : 'HTTP/1.1 404');
  }
  echo $content;
} else { ?>

<html> ... Your GWT host page ... </html>

<? } ?>
于 2012-09-04T00:18:54.143 に答える