問題タブ [ocr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Android ではどの種類の OCR Java ライブラリを使用する必要がありますか?
OCR ライブラリを介して画像をスキャンし、そこからテキストを抽出する Android アプリケーションを構築したいと考えています。
どの Java ライブラリを使用すればよいですか?
wpf - WPFInkCanvas-「署名済み」かどうかを判断する方法
WPF InkCanvasコントロールを使用して、TabletPCアプリケーションで署名をキャプチャしています。
私の要件の1つは、アプリケーションが実際に「署名」されているかどうかを検証することです。現在、InkCanvasのStrokesコレクションをチェックしてこれを行っています。ストロークが0の場合、ユーザーが「署名」していないことがわかります。
ただし、ユーザーが1つのスラッシュ、または1つのドットを入力した場合、これはストロークとしてカウントされ、署名が実際には有効ではない場合でも、検証テストに合格します。
このためのより良いテストを構築する方法についてのアイデアはありますか?確かに、有効な署名とそうでない署名の使用例はかなりあいまいですが、明らかに悪い署名を排除しようと思います。
それとも、これは単純な方法で解決できないのでしょうか?
c# - C# から Acrobat 機能の OCR を呼び出すにはどうすればよいですか?
Adobe Acrobat で OCR 機能を利用できる C# アプリケーションを作成したいと考えています。どうすればこれを呼び出すことができますか? パブリック API はありますか?
text - 高速文字検出
私はそれが何を言っているのか知りたくありません、そしてそれはCAPTCHAのような歪みを扱っていません、私はただたくさんの画像がテキストを含んでいるかどうか知りたいです。
これは、いくつかのアイドル状態のLinuxサーバーで実行されるものであり、cronジョブは1日に複数回大量の画像を処理します。
その過程で私がやりたいことの1つは、テキストを含む画像を破棄することです。誤検知は問題ありませんが、可能な限り破棄する必要のあるテキストを含む画像を識別する場合は、失敗率をゼロパーセントに近づけたいと思います。
pdf - 議会討論の PDF の光学式文字認識
契約作業のために、ドイツ連邦議会からの古い、スキャンされたグラフィックのみの本会議の議定書 PDF を大量にデジタル化する必要があります。
問題は、これらのファイルのほとんどが 2 列形式になっていることです。
サンプルプロトコル http://sert.homedns.org/img/btp12001.png
次の質問に対するあなたの回答をぜひお読みください。
- OCR に入力する前に、2 つの列を分割するにはどうすればよいですか?
- どの商用オープンソース OCR ソフトウェアまたはフレームワークをお勧めしますか?またその理由は?
どのツール、プログラミング言語、フレームワークなどでも問題ないことに注意してください。難解な製品、ライブラリがジャブに適していると思われる場合は、躊躇しないでお勧めします ^__^ !!
更新:これらの文書は議会 o_O:サンプル(上の画像と同じ) によって既にスキャンされており、大量にあり、できるだけ早く契約書を提出したいので、同じ文書の印刷コピーを取りに行くことはできません。自分でスキャンします。それらの数が多すぎます。
宜しくお願いします、
Cetin Sert
android - Android用の無料のOCRライブラリはありますか?
Android上で動作するJavaOCRを探していますが、Aspriseはプラットフォームに依存しないOCRではないようです。Androidアプリケーション開発に使用できるオープンソース/無料のJavaOCRはありますか?
c# - .NET 画像の OCR 処理
MODI を使用してウィンドウのプログラムを OCR しようとしています。次のようにwin32相互運用を使用してプログラムで取得したスクリーンショットでは問題なく機能します。
この画像はファイルに保存され、次のように MODI を実行します。
この部分は問題なく動作しますが、スクリーンショット全体を OCR で処理したくはありません。次のようにプログラムで画像をトリミングしてみます。
次に、この小さな画像をOCRしますが、MODIは例外をスローします。「OCR 実行エラー」、エラー コードは -959967087 です。
MODI は元のビットマップを処理できるのに、元のビットマップから取得した小さいバージョンを処理できないのはなぜですか?
image-processing - 画像処理/超軽量OCR
私は本からの写真である55000の画像ファイル(JPGとTIFF形式の両方で)を持っています。
各ページの構造は次のとおりです。
いくつかのテキスト
---(水平線)---
数
いくつかのテキスト
---(水平線)---
別の番号
いくつかのテキスト
任意のページに0から4本の水平線が存在する可能性があります。
横線のすぐ下にある数字を見つける必要があります。
しかし、数字は1ページ目から始まり、厳密に相互に続いているので、数字を見つけるためにそれを読む必要はありません。水平線の存在を検出するだけで、より簡単で安全なはずです。番号を検出するためにページをOCRしようとしています。
アルゴリズムは、基本的に次のようになります。
問題は、「水平線を数える」部分を実行するのに最適な画像ライブラリ/言語は何でしょうか。
python - OCRトランプ
トランプの画像を入力してランクとスーツを返したいという楽しみのプロジェクトをやろうと思いました。左上隅にすべての情報があるので、左上隅を見るだけでよいと思います。堅牢である必要があります。AceofDiamondsの大きな画像がある場合は、20〜200%の範囲で拡大縮小でき、それでも正しい答えが得られるはずです。
最初の質問-これを行うためにすでに書かれたものはありますか?もしそうなら、私はOCRに何か他のものを見つけるので、私は努力を複製しません。
第二に-これを行うための最良の方法は何ですか?神経網?何か手作業でコーディングしましたか?誰かがポインタを与えることができますか?(0xCAAF9452は受け入れ可能な答えではありません)。