問題タブ [python-camelot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - AttributeError: モジュール 'camelot' には属性 'read_pdf' がありません
camelot を使用して pdf からテーブルを抽出しようとしていますが、この属性エラーが発生します。助けていただけますか?
AttributeError トレースバック (最新の呼び出しが最後) ----> 1 pdf = camelot.read_pdf("Gordian.pdf")
AttributeError: モジュール 'camelot' には属性 'read_pdf' がありません
python - tikzplotlib 使用時の PermissionError
私はPDFファイルを調査しており、作成者によってテキストが画像として埋め込まれている場所を表示しようとしています。
このために、私は Camelot を使用しており、それは Plot 関数です。次に、TikZ を使用してこのグラフを Latex にプロットしようとします。
しかし、悲しいことに、私は最近、オペレーティング システムを Windows に切り替える必要がありました。エラー "PermissionError" : [WinError32] が表示されます。
同期している可能性のあるすべてのクラウド ソリューションを閉じました。また、PC を再起動しました。最初の試行で、コードの残りの部分にコメントを付ければテーブルを抽出できますが、エラー メッセージが再び表示されます。
python - キャメロットPDF抽出FAIL解析
Camelot ライブラリで問題が発生しています
PDF からデータを抽出しています。コードは前の 23 ページで「正常に」実行されていますが、この場合、テキスト/テーブルの末尾の解析に失敗しています。
問題は、文字列が長すぎてテーブルの境界に達していることだと思います
「ストリーム」も試しましたが、最悪の結果になりました
PDFソースデータ
PDF出力レイアウト
解析された出力は次のようになります
望ましい出力は
前のページで正しく機能する最初のコードは
Web サイト Camelot Doc からhttps://camelot-py.readthedocs.io/en/master/api.html pdf パーサーで可能な構成を取得します。
次に、その問題を取得し、より多くのパラメータで「再生」を解決しようとしましたが、勝者が見つかりませんでした
それを避けるために、パラメータについてアドバイスをもらえますか??
ありがとう
edit1: PDF ソース : https://www.siom.it/images/catalogo-motorini-alter.pdf (24 ページ)