問題タブ [amazon-textract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
183 参照

java - OCR AWS Textract サービスが上付き文字/指数の区別に失敗する

Textract AWS サービスを使用しています。

  1. 10 10のような値は 1010 として読み取られます。これにより、不良データが読み取られます。
  2. また、セル内のデータの境界が、それを含むセルの境界と重なることがあります。

これらの問題を解決するにはどうすればよいですか?

0 投票する
0 に答える
77 参照

python - 歴史的調査のために構築された FileMaker Pro (サーバー上ではない) ソリューションから Google Vision Python クライアントを使用しますか?

私はDigital OrientalistのCornelis van Litが「ケンタウルス」と呼んでいるもの、つまり人文科学の研究問題に対するソフトウェア ソリューションの開発に時間を費やす学者です。stackoverflow やその他のオンライン リソースを検索しても解決できない問題に遭遇しました。

私は、元のソースの 150,000 のデジタル サロゲートを管理する FileMaker ソリューションを開発しました。これは、Reddit のユーザー制限付きデータが数年前に提案した方法と似ています。

Google の Vision API を使用してソリューションを拡張したいと考えています。特に、Vision を使用して、これらのデジタル サロゲートに対して OCR を実行したいと考えています。AmazonのTextract APIを使用して、まさに私が求めていることを行うYoutubeビデオを見ました。デジタル サロゲートで Textract を試しましたが、満足のいく結果が得られませんでした。私の代理人はスペイン語で書かれており、かなりの数が手書きです。私の場合、Google の Vision API はより良い結果をもたらしました。また、Vision には、私がよく知っている Python クライアント ライブラリがあります。

したがって、私の問題と質問は、Filemaker Pro Advanced (FILEMAKER SERVER でホストされていない) との Python 統合に関するものです。

オブジェクトフィールドから Python に PDF を渡す方法はありますか? そして、Python が PDF を分割し、個々の画像を処理し、その画像を Vision に送信し、結果を渡し、それらを再結合した後、出力文字列を新しいフィールドで FileMaker に送り返しますか?

トリガーは FileMaker 側からのものであるため、利用可能な Python ライブラリを使用したり、ソリューションを ODBC ソースにすることは役に立ちません。Python スクリプトを実行できる FileMaker プラグインがいくつかありますが、Python が FileMaker からサブプロセスを実行する方法と同じだと思いますが、その方法について明確な指示はありません。私は大学院生なので、コンサルティングにお金を払うことは問題外です。助けてくれる人はいますか?