2

約 8000 行のファイルに対して検索する必要がある 100 万行のドキュメントがあります。最初は lucene を試してみましたが、あまりにも多くの検索帖を検索するのに時間がかかります。そのような検索操作を実行することは可能ですか??? 8000 行を含むプレーン テキスト ドキュメントで、検索文字列に類似する文字列を見つける必要があります。私がルセンで試した可能なアプローチ:

  1. 8000 行のドキュメントをインデックス化し、100 万件の検索クエリを渡します。
  2. 検索クエリを含むドキュメントにインデックスを付け、8000 行のドキュメントを検索クワイアとして渡します。これでさえ正しい考えかどうかはわかりません。
  3. 可能性のあるもの:試したことがない. 両方の文書に索引を付け、類似性を比較します。これもできますか?
4

1 に答える 1