0

私はPythonを使用してPDFファイルのテーブルのWebスクレイピングに取り組んでいます

誰かが私にpypdf、pdf2html、ocr、slateを試したが何も機能しない唯一の必要なテーブルをフェッチする良いモジュールを提案できますか

ありがとう

4

1 に答える 1

3

まず、PDF を HTML に変換します。Python を使用した PDF から HTML への変換を参照してください。

次に、HTML 解析ライブラリを使用して、PDF から生成された HTML を解析します。BeautifulSoup HTML テーブルの解析を参照してください

于 2012-06-07T06:41:26.140 に答える