ファイルを読み取る方法をいくつか探していましたが.pdf
、そこから何も取得できませんでした。おそらくライブラリが必要ですが、見つけたすべてのオプションは非常に混乱し、対処するのが困難です。
このタスクを実行するには、どの方法が最適なのか疑問に思っていました。つまり、 を検索して.pdf
、アブストラクト セクションのコンテンツを取得することです。(これはテキストです)
最も簡単で安価な方法は、人気があり、他のプログラマーに知られているオープン ソース ライブラリを使用することです。
独自の PDF リーダーをゼロから作成する前に、以下を確認してください。
解析:
PoDoFo ライブラリは、PDF ファイルを解析し、その内容をメモリに変更するためのクラスを含む無料の移植可能な C++ ライブラリです。変更は簡単にディスクに書き戻すことができます。パーサーを使用して、PDF ファイルから情報を抽出することもできます (たとえば、パーサーは PDF ビューアーで使用できます)。PoDoFo には、構文解析に加えて、独自の PDF ファイルを作成するための非常に単純なクラスも含まれています。すべてのクラスは文書化されているため、PoDoFo を使用して独自のアプリケーションを簡単に作成できます。