java - JavaでPDFから隠しコンテンツを読み取る

翻译自：https://stackoverflow.com/questions/19419818 2013-10-17T06:36:11.200

622 次

以下のように、いくつかのコードが散らばっている（固定位置なし）いくつかのpdfがあります。

oneCode=abcd
twoCode=4566

また、テキストのフォント色は白（PDFの背景色と同じ）です。したがって、それらは目に見えません。

キー (完全な単語の最初の部分、oneCode、twoCode など) を使用して pdf を解析し、対応する値 (abcd、4566 など) を取得するプログラムを作成したいと考えています。

このような機能は、PDFBox、iText などのオープンソースの PDF パーサーで利用できますか?

例を挙げてください。

読んでくれてありがとう！

1 に答える 1