0

Camelot は、実際には別の行ではない場合でも、一部の行を別の行として扱います。結果は、前の行に属していたはずの行です。

私は Camelot と協力して、銀行の明細書からデータを抽出しています。問題は、Camelot が実際には別の行ではないのに別の行として扱うことです。? 添付の画像でわかるように、2019 年 1 月 9 日のトランザクションは、実際には 1 つしかないのに 3 つの行に分割されています。これは、説明が複数の行にある場合に発生します (元のステートメントが添付されています)。

row_tol と col_tol を最適化しようとしましたが、成功しませんでした。キャメロット内の解決策はありますか? そうでない場合、PANDAS で簡単に修正できるものは何ですか?

tables = camelot.read_pdf('BOA1.pdf',flavor='stream', flag_size=True)
tables

ここに画像の説明を入力

ここに画像の説明を入力

4

0 に答える 0