問題タブ [ocr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
225 参照

colors - OCR: 新しい色を定義するための適切な ColorMatrix を見つける方法は?

私は今、各行の寸法を定義することに行き詰まっています。スクレイピングしたいリストにはさまざまな色が含まれており、選択を最も妨げているのは次のとおりです。

例

ご覧のとおり、私が分析しようとしている写真は、白い背景に緑色のテキストが表示されています。選択の背景は灰色で、テキストは黒です。また、2 行ごとに背景が少し灰色になっていますが、ColorMatrix を使用してコントラストを操作することができました。

参考までに、Greyscale、Negative、SetContrast、SetBrightness などの他の ColorMatrises があります。

線を検索する私の方法は、写真の大部分でうまく機能しますが、選択がそれを妨げます。

だから今、私は立ち往生していて、何をすべきかわかりません。1時間グーグルで検索しましたが、解決策が見つかりませんでした。


テキストに影響を与えずに背景の灰色を選択範囲から白に変換し、残りの画像をグレースケールできるのではないかと思いました。しかし、仕事をするColorMatrixが見つかりません。

あなたはそれを知っていますか、それともより良い解決策を手に入れましたか?

0 投票する
1 に答える
501 参照

c# - ロックビットを使用して黒いピクセルを検索しますが、これはランダムですか?

ロックビットで問題が発生しました。黒いピクセルを検索していますが、正しくないように見えるため、WindowPopup を使用してすべてのピクセルの色を印刷していますが、プログラムが別の画像を使用しているようです。

代替テキスト http://i208.photobucket.com/albums/bb91/Savaronna/pixel-1.jpg?t=1234874238

最初に見つかった黒いピクセルを赤でマークしました。ご覧のとおり、他にも一致するはずのピクセルがいくつかあります。私は何を間違っていますか?

これは私の脚本ですが、私は何か監督していますか?

0 投票する
1 に答える
2269 参照

c# - OCR:画像を比較し、不一致を分類し、これを高速に行う方法は?

私はなんとか各文字をビットマップに保存し、それがどの文字であるかをすばやく判断する方法を探しています。

したがって、すべての可能な文字を1と0の配列に格納し、それらを取得したビットマップの配列と比較しようとしています。

取得した黒のピクセル数の比較、寸法の比較などの簡単なチェックを行うことはできますが、これらのチェックはすべて低速です(推測です)。

したがって、私が探しているのは、すべてのピクセルを下から上にトラフするか、配列を配列のセットと比較して、1つの配列だけが残るまで不一致を並べ替える方法です。しかし、どうすればそれを実装できますか?

ご協力いただきありがとうございます。

スヴェン

0 投票する
3 に答える
1572 参照

c++ - 基本的なピクセル/セル カウント アルゴリズム

おやすみ :)

現在、画像を読み込んでピクセルごとの RGB 値を確認できる DevIL ライブラリを使用しています。個人的な学習プロジェクトとして、Photoshop で自分で作成したいくつかの画像用の非常に基本的な OCR システムを作成しようとしています。

画像のすべての歪みをうまく取り除くことができ、テキストと数字が残りました。私は現在、入力から学習する高度なニューラル ネットワークを探していません。比較的簡単に始めたいので、個々の文字を識別し、それらの文字のピクセルを数えることに着手しました。

2 つの問題があります。

  • 個々のキャラクターの識別。
  • 最も重要なのは、以前にカウントしたピクセルをカウントせずに、接続されたピクセル (同じ色) をカウントするアルゴリズムが必要であることです。私には数学のバックグラウンドがないので、これが私にとって最大の問題です。

この問題について何か助けていただければ幸いです。

編集:

現在使用しているのは C++ であるため、この質問に C++ のタグを付けました。ただし、疑似コードまたは別の言語からの簡単に読み取れるコードも問題ありません。

0 投票する
5 に答える
10882 参照

.net - .NET で手書きを認識するための OCR

手書きを認識できる .NET アプリケーション内で OCR コンポーネントを使用する必要があります。MS Office の MODI コンポーネントを起動して実行すると、印刷されたテキストは認識されますが、手書きは認識されません。

払っても構わない。

誰かお勧めはありますか?

どうもありがとうジム

0 投票する
1 に答える
356 参照

ocr - XSL-FO の正確な配置

OCR の正確な配置が必要なときに、XML-FO ページ ( FOP を介して実行) にアイテムがあります。ページ (または含まれているページ) が編集されるたびに、OCR の行を元の位置に戻すのは非常に困難です。

FOP で正確な配置を指定することは可能ですか。ページ上の前のアイテムによってアイテムが押し出されるのではなく?

0 投票する
2 に答える
3122 参照

c# - ocr の単層パーセプトロンを使用してネットワークをトレーニングする方法は?

OCR技術を使用して画像から文字を認識するプログラムを開発しています。今までは画像をスキャンする方法でしたが、ニューラルネットワークを使わなければなりません。単層パーセプトロンとは何か、それを使用してネットワークをトレーニングする方法を説明してください。