一連の Web サイトをクロールし、ページから特定の情報を抽出し、その特定の情報の全文索引を作成する検索エンジンを実装したいと考えています。
Xapian は、検索エンジン ライブラリに適しているように思えます。
Xapian と統合するためのクローラー/パーサーのオプションは何ですか?
Solr は、オープンソースのクローラー/パーサーと統合するために、Xapian よりも優れた選択肢でしょうか?
一連の Web サイトをクロールし、ページから特定の情報を抽出し、その特定の情報の全文索引を作成する検索エンジンを実装したいと考えています。
Xapian は、検索エンジン ライブラリに適しているように思えます。
Xapian と統合するためのクローラー/パーサーのオプションは何ですか?
Solr は、オープンソースのクローラー/パーサーと統合するために、Xapian よりも優れた選択肢でしょうか?