3

PDF ドキュメント内の最大のテキスト (おそらくタイトルです!) を見つけることができるプログラムを作成する必要があります。Tikaをパーサーとして使用してみましたが、フォント サイズを取得する方法が見つかりませんでした。また、Tika ライブラリは、私が使用するにはあまりにも強力で複雑に思えます。私が使用できるより簡単な方法/ライブラリはありますか? ライブラリを使用せずにPDFを自分で解析する方が簡単ですか? (私はこのアプローチにちょっと興味があります)? もしそうなら、どこから始めるべきですか?

どんな情報でも大歓迎です。

4

1 に答える 1

1

PDFBoxライブラリのfromをオーバーライドしてフォントサイズを抽出するSOでこのメソッドを見つけました。投稿の質問が少し違っていたので、以前は見ませんでした。processTextPositionPDFTextStripper

于 2012-10-25T17:02:53.080 に答える