3

データを読み取る必要のあるPDFドキュメントがあります。私が発見したのは、上記のPDFをXMLドキュメントに変換するときに、そこから読み取ることができる便利なタグがあるため、コードでファイルをxmlに変換する方法が必要であるため、マッパーファイルを使用して読み取ることができるということです。データベースへのデータコンテンツ。

4

1 に答える 1

0

PDFマイナーを使用

PDFMiner は、PDF ドキュメントから情報を抽出するためのツールです。PDF ファイルを他のテキスト形式 (XML/HTML など) に変換できる PDF コンバーターが含まれています。

他の PDF 関連ツールとは異なり、テキスト データの取得と分析に完全に焦点を当てています。PDFMiner を使用すると、ページ内のテキストの正確な位置や、フォントや線などのその他の情報を取得できます。

テキスト分析以外の目的にも使用できる拡張可能な PDF パーサーがあります。

于 2012-08-23T11:44:45.503 に答える