私はPythonを使用してPDFファイルのテーブルのWebスクレイピングに取り組んでいます
誰かが私にpypdf、pdf2html、ocr、slateを試したが何も機能しない唯一の必要なテーブルをフェッチする良いモジュールを提案できますか
ありがとう
私はPythonを使用してPDFファイルのテーブルのWebスクレイピングに取り組んでいます
誰かが私にpypdf、pdf2html、ocr、slateを試したが何も機能しない唯一の必要なテーブルをフェッチする良いモジュールを提案できますか
ありがとう
まず、PDF を HTML に変換します。Python を使用した PDF から HTML への変換を参照してください。
次に、HTML 解析ライブラリを使用して、PDF から生成された HTML を解析します。BeautifulSoup HTML テーブルの解析を参照してください