1

最近、Google は、サイト内のドキュメントや情報を検索するために、Google アプリ エンジン アプリケーションに統合できる新しい検索 APIを作成しました。涼しい!

かなりの量の静的情報を含むかなりの数の Django リソースがあるサイトがあります。新しい Search API を使用して、この情報をサイト全体の検索エンジンに統合したいと考えています。

既存のサイトとコンテンツに使用される多数のテキスト リソースを持っている人にとって、静的な情報 (フラットな HTML ファイルから) をサイトの Search API データストアに統合する最良の方法は何ですか? おまけの質問ですが、このコンテンツを管理して、サイトにページを追加したときにそれらが検索データストアに統合されるようにするための最良の方法は何ですか?

4

1 に答える 1

2

検索 API では、検索可能にするためにドキュメントを検索バックエンドに追加する必要があります。静的リソースの場合、これは、検索 API を使用してそれらをクロールし、検索バックエンドに追加する必要があることを意味します。

おそらく、アップロードのたびにこれを行う必要があります。おそらく最も簡単な方法は、ファイルを走査してタイムスタンプをチェックする cron ジョブを用意することです。それらが最後にトラバースされたときよりも新しい場合 (存在する場合)、それらを検索バックエンドに追加/更新します。cron ジョブの代わりに、トラバーサルをトリガーするハンドラーを定義して、新しいアプリ バージョンをデプロイした後にヒットすることもできます。

于 2012-05-09T15:55:51.750 に答える