ファイル自体の内容をテキスト形式で実際にダンプする方法を探しています。例: 辞書オブジェクトは必要ありません。ある種の抽出戦略オプションは必要ありません。itextsharp が解析に使用するのと同じテキスト ドキュメントが必要なだけです...文字列または文字列ビルダーとしての全体を...
これまでのところ、ツールを使用してこれを行う方法をまだ見つけていません...私の問題は、動的PDFをC#アプリケーションに読み込もうとしていることです...そして、それらの動的PDFができないことは誰もが知っていますiTextSharp によって解析されます (AcroForm と AcroFields は常に空になります)。したがって、ファイル全体の実際のテキスト ダンプを取得できれば、それがどのように見えるかを確認し、この特定のタスクのために自分で解析できると考えました (例: make受信できることがわかっている各ドキュメントのクラスを作成し、見たものに基づいてそこにマップを作成します)。
誰かがそれを手伝ってくれたり、C# で PDF の XML ソースを抽出する方法を見つけたり (LiveCycle の [XML ソース] タブをクリックするようなもの) を手伝ってくれたりしたら、大歓迎です。
ありがとう!
マット