0

ADO を使用する以外に、VB6 を使用して PDF ファイルからデータを抽出する方法はありますか? Acrobat Reader を使用せずに VB6 を使用して PDF ファイルを開くことに成功しましたが、プロジェクトの次のステップでは、PDF ファイルを読み取ってそこからデータを検索する必要があります。たとえば、どのページに「セメント」という単語が表示されていますか?

4

1 に答える 1

1

一般に、外部ライブラリに依存する必要があります。純粋な VB ソリューション (つまり、ファイルをテキストとして読み取り、自分で処理する) は、1 週間で実現できるものではありません。

自動化を介して Adob​​e Acrobat を使用できます。開始するための例は、たとえばhttp://www.freevbcode.com/ShowCode.asp?ID=7066です。ただし、Adobe Reader だけでは不十分であることに注意してください。完全な Acrobat が必要です。他にも一般的な PDF 読み取りライブラリ (poppler など) がありますが、VB6 でそれらを使用するのは難しい場合があります。

一般的に言えば、成功の可能性は「抽出」が何を意味するかによって異なります。簡単に言えば、PDF はメタ情報を含まない純粋に記述的な形式です。つまり、ファイルには「A を (x1,y1) に置き、'foo' を (x2, y2) に置く」などの命令が含まれています。

おそらく最善の方法は、抽出しようとしているデータを、より適したデータ形式 (プレーンテキスト、XML など) で取得することです。

于 2012-05-16T13:11:59.567 に答える