私は次のような多くの表形式の情報を含むPDFファイルを持っています
1 john maklin testing 20000
このPDFファイルのデータをExcelファイルに変換したい。
私は次のような多くの表形式の情報を含むPDFファイルを持っています
1 john maklin testing 20000
このPDFファイルのデータをExcelファイルに変換したい。
1 回限りのことであれば、既に市場で入手可能なソフトウェアを使用することをお勧めします。同様のクエリに回答したSOのこのリンクを参照することをお勧めします。
それが通常のことである場合は、Xpdfをコードに統合して、そのようなアプリケーションを作成することができます。私はそれがかなり厄介になると確信していますが:)
Adobe Professional をインストールしてからプログラムで使用することを提案することもできましたが、私はすでにそのルートをたどりました。同じことをしたくないと確信しています。Adobe は PDF の仕様を公開していますが、各プログラムは pdf の解釈が多少異なるようで、すべてのベンダーが pdf を作成するために異なるガイドラインに従っているという事実を考慮すると、pdf ファイルを読むのが難しくなっています。
Web を検索すると、このリンクに出くわします。彼らは、Xpdf と VBA の統合に成功したと主張しています。私はそれをテストしたことがないので、自分で確認したいかもしれません。VBAに統合できれば、VB.Netにも統合できる可能性が高いです。ただし、pythonについてはわかりません。
他の代替手段は、ファイルをソースで pdf の代わりに csv に直接出力できる場合、pdf から Excel への変換は発生しません。このオプションを行使できるかどうかわかりません。