0

フォームを含む Pdf ファイルを解析して、Web サーバー上のフィールドの位置とページ番号を取得するにはどうすればよいですか? たとえば、次のような構造の pdf があります。

<</AcroForm 23 0 R/Metadata 2 0 R/Outlines 6 0 R/Pages 9 0 R/Type/Catalog>>
endobj
19 0 obj
<</DA(/ZaDb 0 Tf 0 g)/FT/Btn/Ff 49152/Kids[18 0 R 20 0 R]/T(Language)>>
endobj
23 0 obj
<</DA(/Helv 0 Tf 0 g )/DR<</Encoding<</PDFDocEncoding 26 0 R>>/Font<</Helv 22 0 R/ZaDb 35 0 R>>/XObject<</DSz 51 0 R>>>>/Fields[19 0 R 21 0 R 39 0 R 16 0 R 17 0 R 46 0 R 47 0 R 48 0 R]/SigFlags 1>>
endobj
25 0 obj
<</BBox[0.0 0.0 72.0 20.0]/FormType 1/Length 102/Matrix[1.0 0.0 0.0 1.0 0.0 0.0]/Resources<</Font<</Helv 22 0 R>>/ProcSet[/PDF/Text]>>/Subtype/Form/Type/XObject>>stream
1 g
0 0 72 20 re
f
/Tx BMC
q
2 1 68 18 re

PHP または JavaScript を使用して、このコードからフィールドの位置を取得するにはどうすればよいですか? または、どのライブラリ/ユーティリティを試すことができますか? Pdftk は私の問題を解決できません :( ありがとう。

4

1 に答える 1

0

残念ながら、PDF をテキストであるかのようにスキャンしようとしても、それ以上の情報を取得することはできません。

Java用のItext PDFライブラリを使用してこの問題を解決します。ここを参照してください:

Itextは既存のPDFからフィールド座標を取得します

于 2013-09-28T20:03:17.010 に答える