以下のように、いくつかのコードが散らばっている(固定位置なし)いくつかのpdfがあります。
oneCode=abcd
twoCode=4566
また、テキストのフォント色は白(PDFの背景色と同じ)です。したがって、それらは目に見えません。
キー (完全な単語の最初の部分、oneCode、twoCode など) を使用して pdf を解析し、対応する値 (abcd、4566 など) を取得するプログラムを作成したいと考えています。
このような機能は、PDFBox、iText などのオープン ソースの PDF パーサーで利用できますか?
例を挙げてください。
読んでくれてありがとう!