3

PDFrw を使用して特定の PDF からデータを取得しようとしています (ページの右上にあるものとしましょう)。これを行うためにPDFrwを使用しています。彼らが提供するドキュメンテーションに目を通し(あまり見つけることができませんでした)、彼らがgitに投稿したサンプルコードを見ましたが、やりたいことをするのに十分な情報をまとめて得ることができないようです。PDFrw(または、より良いものがある場合は別のもの)を使用してPDFに入り、特定のテキストを抽出する簡単なプログラムを作成するにはどうすればよいですか。それをhtmlに変換しようと思っていたのですが… その方が簡単でしょうか?例として上記の PDF を見てください。(たとえば) 電圧を取得したいと思います。PDF では 600 w です...これを最も簡単な方法で行うにはどうすればよいですか? これに関する他のスタック オーバーフローの質問は見つかりませんでした。

ありがとう!

4

1 に答える 1

11

私は pdfrw の作成者ですが、このために設計されたものではありません。おそらくpdfminerを見るべきです。

于 2015-07-15T14:55:53.593 に答える