問題タブ [text-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
signals - テキスト検出前のフーリエ変換ベースの画像圧縮
1x8 データの DCT [8,16,24,32,40,48,56,64] --(dct8)--> [100,-52,0,-5,0,-2,0,0.4] . ここで切り捨て (つまり、低周波成分を破棄) し、その 1x4 データの逆 DCT を 1x8 間隔で次のように取得すると、[100,-52,0,-5] --(idct8)--> [8,15, 24,32,40,48,57,63] . つまり、ほぼ同じデータが得られます。
これを使用して、2D DCT を適用し、続いて低周波数値を破棄して (信号のエネルギーのほとんどが高周波数にあるため)、つまり、右下の象限を破棄してから 2D IDCT を実行して、jpeg 画像のサイズを縮小できますか?
PS : 「テキスト認識」に取り組む必要があるため、非可逆圧縮がパフォーマンスに影響を与えることはなく、はるかに高速になる可能性があります。
android - テキスト認識OCR Android:アクティビティを開始するためのエラー
カメラを使用してテキストを認識するには、Google のテキスト認識 API を使用する必要があります。コードをダウンロードすると、完全に機能します。しかし、グローバル変数に保存されている特定の単語を識別する必要があるプロジェクトを開発しています。単語が識別されたときに別のアクティビティを開始するのに問題があります。テキスト認識を行うコードの一部を次に示します。
別のアクティビティを開始しようとすると、次のエラーが発生します。
実際に別のアクティビティを開始する必要はありません。テキスト認識を特定の単語と比較する必要があります。
また、グローバル変数の値を取得しようとすると、次のエラーが発生します。
私はそれを修正する方法を本当に知りません。助けていただければ幸いです。ありがとう
matlab - 検出された各文字の個別の画像を取得する
画像からテキストを検出するために、この matlab コード (以下を参照) を作成しました。このコードは画像からテキストを検出していますが、画像から検出された文字ごとに出力画像を作成したいと考えています。どうすればそれができるか教えてください。
コード:
android - ビットマップからテキストを抽出する Google Vision API
スクリーンショットからテキストを抽出するアプリケーションを開発しようとしていますが、これらのデータ (数値とテキスト) を使用して何かを行います。動作しますが、期待どおりではありません。まったく正確ではありません。奇妙なことは、同じ解像度の同じスクリーンショットが、私のアプリケーションとGoogle Vision API サイトの「try API」によって異なる方法で認識されることです。
例: テキストとして「410」を含むスクリーンショットは、アプリによって「A10」として認識されました。それ以外の場合、Google API サイトは 410 を適切に認識します
Google Keep OCR が私のアプリよりも優れていることに気付きました。同じ API を使用していますか? Google Keep または Google Vison API サイトとしてのアプリのテキスト認識を改善するにはどうすればよいですか?
ここに私のコードがあります:
オククラス
Android マニフェスト
グラドル
node.js - Tesseract - 入力座標の画像からテキストを抽出する方法は?
画像と座標を入力する必要があります。入力座標に存在するテキストは、出力として読み取る必要があります。node-tesseract を使用してこれを行う方法は?