Python 3.7 と Camelot 0.7.3。現在、Camelotはファイル名に「 page- -table-」が追加された変換済みファイルをエクスポートします。アプリケーションには非常に具体的なファイル名の要件があり、ファイル名に余分な文字列を追加せずにファイルをエクスポートしようとしています。 . これは可能ですか?ドキュメントには、これを回避する方法については何も言及されていません。
質問する
362 次
1 に答える
0
ドキュメントには、これを回避する方法については何も言及されていません。
私はあなたが何を意味するのか分かりません。https://camelot-py.readthedocs.io/en/master/言います:
PDF ファイルから表を抽出する方法は次のとおりです。この例で使用されている PDF を確認してください。
>>> import camelot >>> tables = camelot.read_pdf('foo.pdf') >>> tables <TableList n=1> >>> tables.export('foo.csv', f='csv', compress=True) # json, excel, html
を使用tables.export
すると、PDF 内のすべてのテーブルがエクスポートされてファイルが分離され、ファイル名でそれらを区別する必要があります。
特定のテーブルのみをエクスポートする必要がある場合は、ページのさらに下にある例を使用してください。
>>> tables[0].to_csv('foo.csv') # to_json, to_excel, to_html
https://github.com/camelot-dev/camelot/blob/master/camelot/core.py#L571pandas.DataFrame.to_csv
に見られるように、これは変更されていないファイル名を に渡します。
于 2020-03-12T19:44:50.210 に答える