2

PDFTextStripper クラスを使用して、Lucene インデックス作成の前に PDF テキストを抽出します。

抽出されたテキストから pdf ヘッダーとフッターを除外する可能性はありますか?

4

1 に答える 1

0

ドキュメント内のヘッダーとフッターの正確な位置がわかっている場合は、領域ごとのテキスト抽出を使用できます。お役に立てれば。

于 2013-04-06T13:28:40.750 に答える