2

Adobe Acrobat Pro を使用して、PDF から XML 形式で情報を抽出しています。Acrobat はこれを特にうまく行います。約 1000 のドキュメントから情報を抽出し、その情報を処理したいので、Acrobat を手動で使用するのは面倒です。共通言語、理想的には Python から Acrobat 関数を呼び出す (つまり、XML として保存する) プラグインはありますか?

4

2 に答える 2

1

Windows を使用している場合は、DDE コマンドを使用して Acrobat と通信できます。このモジュールは DDE 呼び出しをサポートしています。または、このスタンドアロン バインディングでpyWin32運試しをすることもできます。

ただし、Acrobat に送信する要求を把握する必要があります。(ここにいくつかのランダムなドキュメントがありますが、XMLについては言及されていません)。コマンドはバージョンごとに変更されているようです (または、少なくともいくつかの機能が壊れている) ため、バージョンに注意してください。幸運を。

于 2012-11-05T00:20:20.933 に答える