1

DOC、DOCX、HTML、および PDF のドキュメントを検索するために、Lucene/Solr、Whoosh、Sphinx、および Xapian を比較しています。Solr だけが、ドキュメントを直接インデックス化するドキュメント パーサー (Tika) を持つことが文書化されています。したがって、明らかに勝者のようです。

しかし、競争条件を公平にするために、私は代替案を検討するのが好きです. 他の人には直接ドキュメントのインデックス作成がありますか (私が見逃している可能性があります)? そうでない場合、簡単に実装できますか?それともSolrが圧倒的な選択肢ですか?

4

1 に答える 1