既存の完全に静的な Web サイトに検索機能を追加しようとしています。おそらく、新しい検索機能自体は動的である必要があります。これは、検索インデックスを定期的に更新する必要があり (人々が静的コンテンツに変更を加えたときに)、ユーザーが操作したときに検索結果を動的に生成する必要があるためです。 . Python を使用してこの機能を追加したいと考えています。これは私の好みの言語ですが、アイデアは自由です。
この場合、インデックスに登録されているコンテンツはプライベート ネットワーク上にあるため、Google Web Search API は機能しません。Django haystack は、コンテンツを Django モデルに格納する必要があるため、この場合には機能しません。mnoGoSearch と呼ばれるツールは、Google のように Web サイトをスパイダーできると思うので、オプションになるかもしれませんが、そのプロジェクトがどれほど活発であるかはわかりません。プロジェクトサイトは少し古いようです。
Solr、ElasticSearch、Whoosh などのツールの使用に興味がありますが、これらのツールは単なるインデックス作成エンジンであり、検索コンテンツの解析は処理しないと思います。検索結果のセットとして取得するために静的な html コンテンツをインデックス化する方法について、誰かに推奨事項はありますか? 読んでいただき、またフィードバックをお寄せいただきありがとうございます。