1

既存の完全に静的な Web サイトに検索機能を追加しようとしています。おそらく、新しい検索機能自体は動的である必要があります。これは、検索インデックスを定期的に更新する必要があり (人々が静的コンテンツに変更を加えたときに)、ユーザーが操作したときに検索結果を動的に生成する必要があるためです。 . Python を使用してこの機能を追加したいと考えています。これは私の好みの言語ですが、アイデアは自由です。

この場合、インデックスに登録されているコンテンツはプライベート ネットワーク上にあるため、Google Web Search API は機能しません。Django haystack は、コンテンツを Django モデルに格納する必要があるため、この場合には機能しません。mnoGoSearch と呼ばれるツールは、Google のように Web サイトをスパイダーできると思うので、オプションになるかもしれませんが、そのプロジェクトがどれほど活発であるかはわかりません。プロジェクトサイトは少し古いようです。

Solr、ElasticSearch、Whoosh などのツールの使用に興味がありますが、これらのツールは単なるインデックス作成エンジンであり、検索コンテンツの解析は処理しないと思います。検索結果のセットとして取得するために静的な html コンテンツをインデックス化する方法について、誰かに推奨事項はありますか? 読んでいただき、またフィードバックをお寄せいただきありがとうございます。

4

1 に答える 1

1

Solr を使用すると、インデックスを作成するコンテンツを取得し、各項目からターゲット部分を解析して、インデックス作成のためにそれを Solr に送信するコードを記述します。

次に、Solr と対話して検索し、インデックス付きドキュメント全体の ID または元のインデックス付きコンテンツに関するその他の識別情報を返すようにし、それを使用して結果をユーザーに表示します。

于 2013-01-28T20:49:16.823 に答える