32

私は現在プロジェクトに取り組んでおり、私の目標は画像内のテキストを見つけることです。テキストをOCRすることは、まだ私の意図ではありません。基本的に、画像内のテキストの境界を取得したい。操作に AForge.Net イメージング コンポーネントを使用しています。何らかの形で支援はありますか?

2009 年 2 月 5 日更新: それ以来、私は自分のプロジェクトで別のルートをたどってきました。ただし、MODI (Microsoft Office Document Imaging) を使用してテキストを取得しようとしました。画像をOCRし、そこからテキストを簡単に引き出すことができます。

4

4 に答える 4

14

これは活発な研究分野です。このテーマに関する学術論文は文字通りたくさんあります。特に詳細がないと、支援を提供するのが難しくなります。特定の種類のテキストをお探しですか? フォント?英語だけ?あなたは学術文献に精通していますか?

「テキスト検出」は、どの OCR (光学式文字認識) システムでも標準的な問題であり、その結果、インターウェブ上にはそれを処理するコードがたくさんあります。

Google からのリンクの山のリストを開始することもできますが、「テキスト検出」を検索して読み始めることをお勧めします :)。サンプルコードも豊富に用意されています。

于 2008-08-05T03:24:27.840 に答える
3

画像内のテキストを認識することは、その分野の研究者にとって確かにホットなトピックですが、キャプチャがスパムボットに対する防御の観点から「標準」になったときに初めて制御不能になり始めました。なぜキャプチャを保護として使用するのですか?画像内のテキストを見つける(そして読む)のは非常に難しい/大変だったからです!

私がキャプチャについて言及する理由は、最も進歩*がその小さな領域内で行われるためであり、あなたの解決策はそこで最もよく見つかると思います。特に、キャプチャは、雑然とした画像内にテキスト(またはテキストに似たもの)を配置し、その後、文字を正しく読み取ろうとすることを目的としているためです。

したがって、優れたオープンソースのキャプチャ破壊ツールを見つけることができれば、おそらく探求を続けるために必要なすべてが揃っています...
これらのOCRは読み取りに使用されるため、文字認識自体を処理する最も難しいコードを破棄することもできます。歪んだテキスト、あなたがする必要がない何か。

*:「非研究者」のための目に見える、使用可能な、そして実用的な情報の面での進歩

于 2008-08-05T06:00:46.417 に答える
0

このためにオンラインAPIを使用しても問題がない場合は、http://www.wisetrend.com/wisetrend_ocr_cloud.shtmlのAPIで、 OCRだけでなくテキスト検出も実行できます。

于 2010-06-23T05:49:10.160 に答える