問題タブ [amazon-textract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

163 問題

0 投票する

1 に答える

385 参照

python - AWS Textract テーブルの抽出で、内部にコンマが含まれる整数を含む行が別の列に分割されました

AWS Textract を使用して、イメージを Python のテーブルに変換し、CSV としてダウンロードしたいと考えています。

そこで、AWS のドキュメントとサンプルコードに従いました: https://github.com/awsdocs/aws-doc-sdk-examples/blob/master/python/example_code/texttract/textract_python_table_parser.py

上記のリンクのコードは、整数のコンマを別の列に分離するようです。以下のエラーを再現するための画像と手順を説明します。

これは、画像形式の私のテーブルの例です。

エラーを再現したい場合は、github リポジトリのコードを複製し、cmd/terminal に次のコードを入力します。

エラーは以下に添付されているとおりです。

["Amount (USD)"] 列でわかるように、カンマを含む値は ["Transaction Date"] 列に分割されます。pandasでcsvファイルを読んでもうまくいきませんでした。

GitHub リポジトリのどのコード行がコンマ区切りを別の列に分割したのだろうか

python amazon-web-services csv amazon-textract

2020-03-04T10:18:49.240

1 2 3 4 5 6 7 8 9 10