問題タブ [python-camelot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
124 参照

python - PDFテーブルデータをデータベースに挿入する方法

Camelot を使用して pdf テーブル データを抽出しましたが、CSV に変換する必要があるように、テーブル データをデータベースに入れるにはどうすればよいですか? それを私のデータベースに入れる他の方法はありますか?私の特定のテーブルを選択したり、テーブルの数を入れたりする他の方法はありますか。ここで、テーブル番号を指定する必要があります。抽出されます。

以下は、値をDBに入れたいpdfのテーブルデータです

ここに画像の説明を入力

0 投票する
2 に答える
4724 参照

python - PDFからのテーブル抽出のためのタブラとキャメロット

PDFからテーブルを抽出する必要があります。これらのテーブルは、任意のタイプ、複数のヘッダー、垂直ヘッダー、水平ヘッダーなどにすることができます.

私は両方の基本的なユースケースを実装しましたが、すべてのテーブルを完全に検出できないキャメロットよりもタブラの方が少し優れていることがわかりました。すべての種類で機能するかどうかはわかりません。

したがって、同様のユースケースを実装した専門家からの提案を求めてください。

PDF の例: PDF1 PDF2 PDF3

表の実装:

キャメロットの実装: