問題タブ [python-camelot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
6 に答える
14577 参照

python - AttributeError: モジュール 'camelot' には属性 'read_pdf' がありません

camelot を使用して pdf からテーブルを抽出しようとしていますが、この属性エラーが発生します。助けていただけますか?

AttributeError トレースバック (最新の呼び出しが最後) ----> 1 pdf = camelot.read_pdf("Gordian.pdf")

AttributeError: モジュール 'camelot' には属性 'read_pdf' がありません

0 投票する
0 に答える
70 参照

python - tikzplotlib 使用時の PermissionError

私はPDFファイルを調査しており、作成者によってテキストが画像として埋め込まれている場所を表示しようとしています。

このために、私は Camelot を使用しており、それは Plot 関数です。次に、TikZ を使用してこのグラフを Latex にプロットしようとします。

しかし、悲しいことに、私は最近、オペレーティング システムを Windows に切り替える必要がありました。エラー "PermissionError" : [WinError32] が表示されます。

同期している可能性のあるすべてのクラウド ソリューションを閉じました。また、PC を再起動しました。最初の試行で、コードの残りの部分にコメントを付ければテーブルを抽出できますが、エラー メッセージが再び表示されます。

0 投票する
1 に答える
2466 参照

python - キャメロットPDF抽出FAIL解析

Camelot ライブラリで問題が発生しています

PDF からデータを抽出しています。コードは前の 23 ページで「正常に」実行されていますが、この場合、テキスト/テーブルの末尾の解析に失敗しています。

問題は、文字列が長すぎてテーブルの境界に達していることだと思います

「ストリーム」も試しましたが、最悪の結果になりました

PDFソースデータ

pdf

PDF出力レイアウト

レイアウト

解析された出力は次のようになります

望ましい出力は

前のページで正しく機能する最初のコードは

Web サイト Camelot Doc からhttps://camelot-py.readthedocs.io/en/master/api.html pdf パーサーで可能な構成を取得します。

次に、その問題を取得し、より多くのパラメータで「再生」を解決しようとしましたが、勝者が見つかりませんでした

それを避けるために、パラメータについてアドバイスをもらえますか??

ありがとう

edit1: PDF ソース : https://www.siom.it/images/catalogo-motorini-alter.pdf (24 ページ)