pdf
フォーム フィールドを含むファイルがあり、データを自動的にファイルにエクスポートする必要がありxml
ます。テスト用に作成したサンプル フォームの画面を次に示します。
注: Acrobat Professional をクリックして手動Tools > Form > Export Form Data
でエクスポートし、最終的にファイル出力の xml 拡張子を選択すると、うまく機能します。これは、手動でエクスポートしたときに得られる結果です。
<?xml version="1.0" encoding="UTF-8"?>
<fields>
<first_name>John</first_name>
<last_name>Doe</last_name>
</fields>
ただし、Pythonスクリプト、Java実装、またはコマンドラインツールなどを使用して自動化する必要があります。フォームフィールドデータをエクスポートするために使用できるライブラリまたはツールのアイデアはありますxml
か? ツールまたはライブラリは、ワークフローに統合できるオープン ソースである必要があります。
私はすでに python ライブラリを試しました。これは、pdf ファイルのpdfminer
静的部分 ( Static form header
、First name:
および など)をエクスポートするのに役立ちました。Last name:
first_name
last_name
編集:ここから sample.pdf ファイルを自由にダウンロードしてください。