私たちの代理店は、多くの AJAX インタラクションと #! (ハッシュバン) URL: http://www.gunlawsbystate.com/
スクロールできる長い本で、アドレスバーの URL が動的に変化します。IE をサポートする必要があるため、pushState の使用を勧めないでください。現時点では、hansbang が唯一のオプションです。
左側のサイドバーには、本のすべての章へのリンクを含むナビゲーションがあります。
リンクの例: http://www.gunlawsbystate.com/#!/federal-properety/national-parks-and-wildlife-refuges/
Google がこれをクロールすることを期待しています: http://www.gunlawsbystate.com/?_escaped_fragment_=/federal-properety/national-parks-and-wildlife-refuges/ これはセクションの完全な html スナップショットです。(+ www.gunlawsbystate.com/#!/federal-properety/national-parks-and-wildlife-refuges/ii-change-in-the-law/ => www.gunlawsbystate.com/ のようなサブセクションへのリンクがあります?_escaped_fragment_=/federal-properety/national-parks-and-wildlife-refuges/ii-change-in-the-law/ )。
Google の仕様 ( developers.google.com/webmasters/ajax-crawling/docs/specification ) によると、すべてが完了しているように見えます。サイトは現在約 3 か月間運営されています。ホームページは 10 ~ 15 日ごとに再インデックスされます。
問題は、何らかの理由で Google がハッシュバン URL を適切にクロールしないことです。Google はこれらの URL を単に「気に入らない」ようです。
www.google.ru/search?&q=site%3Agunlawsbystate.com : わずか 67 ページがインデックスに登録されています。Google がインデックスに登録したほとんどのページには「通常の」URL (主にワードプレスのブログ投稿、カテゴリ、およびタグ) があり、結果ページのわずか 5 ~ 10% がハッシュバング URL であることに注意してください。それが適切にクロールされるかどうかは本当に好きです。
Google が本のページを適切にクロールしない理由について、誰かアドバイスをいただけないでしょうか? どんな助けでも大歓迎です。
PS クリックできないリンクで申し訳ありません — stackoverflow では 2 つ以上投稿することはできません。
アップデート。サイトマップは、しばらく前に Google に送信されました。Google ウェブマスター ツールによると、518 件の URL が送信され、インデックスに登録された URL は 62 件だけでした。また、ウェブマスター ツールの [インデックス ステータス] ページには、これまでにクロールされたページが 1196 あることがわかります。1071 ページが選択されていません。これは、何らかの理由で Google が #! をインデックスに登録していないことを明確に示しています。頻繁にアクセスするページ。