問題タブ [amazon-textract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - OCR AWS Textract サービスが上付き文字/指数の区別に失敗する
Textract AWS サービスを使用しています。
- 10 10のような値は 1010 として読み取られます。これにより、不良データが読み取られます。
- また、セル内のデータの境界が、それを含むセルの境界と重なることがあります。
これらの問題を解決するにはどうすればよいですか?
python - 歴史的調査のために構築された FileMaker Pro (サーバー上ではない) ソリューションから Google Vision Python クライアントを使用しますか?
私はDigital OrientalistのCornelis van Litが「ケンタウルス」と呼んでいるもの、つまり人文科学の研究問題に対するソフトウェア ソリューションの開発に時間を費やす学者です。stackoverflow やその他のオンライン リソースを検索しても解決できない問題に遭遇しました。
私は、元のソースの 150,000 のデジタル サロゲートを管理する FileMaker ソリューションを開発しました。これは、Reddit のユーザー制限付きデータが数年前に提案した方法と似ています。
Google の Vision API を使用してソリューションを拡張したいと考えています。特に、Vision を使用して、これらのデジタル サロゲートに対して OCR を実行したいと考えています。AmazonのTextract APIを使用して、まさに私が求めていることを行うYoutubeビデオを見ました。デジタル サロゲートで Textract を試しましたが、満足のいく結果が得られませんでした。私の代理人はスペイン語で書かれており、かなりの数が手書きです。私の場合、Google の Vision API はより良い結果をもたらしました。また、Vision には、私がよく知っている Python クライアント ライブラリがあります。
したがって、私の問題と質問は、Filemaker Pro Advanced (FILEMAKER SERVER でホストされていない) との Python 統合に関するものです。
オブジェクトフィールドから Python に PDF を渡す方法はありますか? そして、Python が PDF を分割し、個々の画像を処理し、その画像を Vision に送信し、結果を渡し、それらを再結合した後、出力文字列を新しいフィールドで FileMaker に送り返しますか?
トリガーは FileMaker 側からのものであるため、利用可能な Python ライブラリを使用したり、ソリューションを ODBC ソースにすることは役に立ちません。Python スクリプトを実行できる FileMaker プラグインがいくつかありますが、Python が FileMaker からサブプロセスを実行する方法と同じだと思いますが、その方法について明確な指示はありません。私は大学院生なので、コンサルティングにお金を払うことは問題外です。助けてくれる人はいますか?