1

Python 3.7 と Camelot 0.7.3。現在、Camelotはファイル名に「 page- -table-」が追加された変換済みファイルをエクスポートします。アプリケーションには非常に具体的なファイル名の要件があり、ファイル名に余分な文字列を追加せずにファイルをエクスポートしようとしています。 . これは可能ですか?ドキュメントには、これを回避する方法については何も言及されていません。

4

1 に答える 1

0

ドキュメントには、これを回避する方法については何も言及されていません。

私はあなたが何を意味するのか分かりません。https://camelot-py.readthedocs.io/en/master/言います:

PDF ファイルから表を抽出する方法は次のとおりです。この例で使用されている PDF を確認してください。

>>> import camelot
>>> tables = camelot.read_pdf('foo.pdf')
>>> tables <TableList n=1>
>>> tables.export('foo.csv', f='csv', compress=True) # json, excel, html

を使用tables.exportすると、PDF 内のすべてのテーブルがエクスポートされてファイルが分離され、ファイル名でそれらを区別する必要があります。

特定のテーブルのみをエクスポートする必要がある場合は、ページのさらに下にある例を使用してください。

>>> tables[0].to_csv('foo.csv') # to_json, to_excel, to_html

https://github.com/camelot-dev/camelot/blob/master/camelot/core.py#L571pandas.DataFrame.to_csvに見られるように、これは変更されていないファイル名を に渡します。

于 2020-03-12T19:44:50.210 に答える