ヘッドレス ブラウザを起動して、javascript (具体的には sammy.js) を使用して AJAX コンテンツを配信するサイトの静的な HTML スナップショットを提供する方法を理解するのに本当に苦労しています。
私は、AJAX アプリをクロール可能にするための Google の仕様に取り組んでいます。
http://code.google.com/web/ajaxcrawling/docs/getting-started.html
これは大部分が素晴らしく、非常に明確であり、?_escaped_fragment_ URL を拾うのに問題はありません。
テンプレート作成のほとんどはサーバー側で行われるため、さまざまなテンプレート ファイルに含めるために、sammy アプリ コード (多くのルートがあります) からの同じ正規表現一致を使用する PHP スナップショット作成ファイルを作成することにしました。ただし、アクションの多くは JavaScript アプリで発生するため、PHP ですべての処理をミラーリングすることになります。つまり、両方のファイルを横に並べてクロス言語で維持することになります。これは大変な作業です。
ここで、ヘッドレス ブラウザを使用してページを「レンダリング」し、すべての JavaScript を実行して (#!/ ルートに一致し、リクエストに対して正しいコンテンツを配信する)、DOM コンテンツ全体を HTML として返すことができることを読みました。これは googlebot に提供されます。
私は長く懸命に検索しましたが、PHP からヘッドレスブラウザーを実行するためのステップバイステップのガイドを見つけることができません (完全な Java 初心者向け)。つまり、何を検索すればよいかわからないということです。
私が疑問に思っているのは、これらの HTML スナップショットを提供するためにヘッドレス ブラウザをセットアップして使用するのはさらに面倒なことでしょうか? もしそうなら、とにかくやる価値はありますか?
また、私に指摘できるガイドがあれば、それは素晴らしいことです!
ありがとう!
ジョス