0

重複の可能性:
Luceneでpdf、ppt、xlファイルのインデックスを作成する方法(JavaベースまたはPythonまたはPHPのいずれかで問題ありません)?

pdf、docx、txt形式を含むフォルダ内のファイルのコレクションで文字列を検索する必要があります。lucene.netを使用して文字列を検索することは可能ですか?

これに役立つ参考資料をいくつか教えてください。

ありがとう..

4

1 に答える 1

5

さまざまなファイル (pdf、docx、txt) のテキストを抽出し、そのテキストを Lucene インデックスに挿入する必要があります。Lucene には、さまざまなドキュメント形式からテキストを読み取る機能がありません

通常、「{ドキュメント形式} テキストを .net で抽出」を検索すると、多くのリソースが見つかるはずです。

于 2012-05-09T07:42:34.833 に答える