0

Apache Lucene 4.4 を使用して PDF ファイルのインデックスを作成しようとしています

次の例外が発生し続けます。

Exception in thread "main" java.lang.NoSuchFieldError: TOKENIZED
at com.snowtide.pdf.lucene.LuceneInterface20.addField(SourceFile:18)
at com.snowtide.pdf.lucene.PDFDocumentFactory.buildPDFDocument(SourceFile:174)
at com.snowtide.pdf.lucene.PDFDocumentFactory.buildPDFDocument(SourceFile:84)
at com.apache.lucene.search.EasyLuceneIntegration.addPDFToIndex(EasyLuceneIntegration.java:134)
at com.apache.lucene.search.EasyLuceneIntegration.main(EasyLuceneIntegration.java:62)

私は PDFTextStream を使用しており、ここでその例に従っています: ここ にリンクの説明を入力してください

4

1 に答える 1

1

The project you've referenced only supports up to Lucene 2.2. I'd recommend looking into , to get your PDFs into an acceptable format, or you can just use (which, I believe, is the package Tika uses for PDFs).

于 2013-07-24T19:26:27.170 に答える