c# - 画像内のテキストの検索

Question

私は現在プロジェクトに取り組んでおり、私の目標は画像内のテキストを見つけることです。テキストをOCRすることは、まだ私の意図ではありません。基本的に、画像内のテキストの境界を取得したい。操作に AForge.Net イメージングコンポーネントを使用しています。何らかの形で支援はありますか？

2009 年 2 月 5 日更新: それ以来、私は自分のプロジェクトで別のルートをたどってきました。ただし、MODI (Microsoft Office Document Imaging) を使用してテキストを取得しようとしました。画像をOCRし、そこからテキストを簡単に引き出すことができます。

score 14 · Accepted Answer

これは活発な研究分野です。このテーマに関する学術論文は文字通りたくさんあります。特に詳細がないと、支援を提供するのが難しくなります。特定の種類のテキストをお探しですか? フォント？英語だけ？あなたは学術文献に精通していますか？

「テキスト検出」は、どの OCR (光学式文字認識) システムでも標準的な問題であり、その結果、インターウェブ上にはそれを処理するコードがたくさんあります。

Google からのリンクの山のリストを開始することもできますが、「テキスト検出」を検索して読み始めることをお勧めします :)。サンプルコードも豊富に用意されています。

score 3 · Accepted Answer

画像内のテキストを認識することは、その分野の研究者にとって確かにホットなトピックですが、キャプチャがスパムボットに対する防御の観点から「標準」になったときに初めて制御不能になり始めました。なぜキャプチャを保護として使用するのですか？画像内のテキストを見つける（そして読む）のは非常に難しい/大変だったからです！

私がキャプチャについて言及する理由は、最も進歩*がその小さな領域内で行われるためであり、あなたの解決策はそこで最もよく見つかると思います。特に、キャプチャは、雑然とした画像内にテキスト（またはテキストに似たもの）を配置し、その後、文字を正しく読み取ろうとすることを目的としているためです。

したがって、優れたオープンソースのキャプチャ破壊ツールを見つけることができれば、おそらく探求を続けるために必要なすべてが揃っています...
これらのOCRは読み取りに使用されるため、文字認識自体を処理する最も難しいコードを破棄することもできます。歪んだテキスト、あなたがする必要がない何か。

*：「非研究者」のための目に見える、使用可能な、そして実用的な情報の面での進歩

score 0 · Accepted Answer

このためにオンラインAPIを使用しても問題がない場合は、http：//www.wisetrend.com/wisetrend_ocr_cloud.shtmlのAPIで、 OCRだけでなくテキスト検出も実行できます。

4 に答える 4