image - 画像内のテキストのローカリゼーションに適したアルゴリズムはありますか？

Question

画像内のテキスト候補を検出する優れたテキストローカリゼーションアルゴリズムをご存知でしょうか（私のOCRプロジェクトの場合）

基本的に、このアルゴリズムを「適用」した後、文字候補を含む領域（バウンディングボックス）を取得できるようにしたいと思います。

ここに画像の説明を入力してください

私は自分が使うかもしれない何かを見つけようとしていますが、何かを見つけたとしても、それは非常に難しい論文で、適用する必要のある非常に高い数学を持っている可能性が高いです。私はすでにMSER（Maximally Stable Extremal Regions）またはGradient Vector Flowメソッドに遭遇しましたが、どちらも私には非常に困難です（数学では多くのことを理解していますが、これらを理解するのはまだ難しいです）

score 3 · Accepted Answer

これらはあなたにいくつかの指針を与えるかもしれません：

score 3 · Accepted Answer

Opencv3.0の「Scene Text Detection」機能を利用できます。これは、「シーンテキスト検出のためのクラス固有の極値領域」に基づいています。サンプルコードもあります。

それらは次の場所にあります。

[1] http://docs.opencv.org/3.0-beta/modules/text/doc/erfilter.html

[2] https://github.com/Itseez/opencv_contrib/blob/master/modules/text/samples/textdetection.cpp

論文:

[Neumann12] Neumann L.、Matas J.: Real-Time Scene Text Localization and Recognition、CVPR 2012。この論文は、 http: //cmp.felk.cvut.cz/~neumalu1/neumann-cvpr2012.pdf でオンラインで入手できます。

[Neumann11] Neumann L., Matas J.: Text Localization in Real-world Images using Efficiently Pruned Exhaustive Search, ICDAR 2011. この論文は、http://cmp.felk.cvut.cz/~neumalu1/icdar2011_article でオンラインで入手できます。 pdf

[Gomez13] Gomez L. and Karatzas D.: Multi-script Text Extraction from Natural Scenes、ICDAR 2013。この論文は、http: //158.109.8.37/files/GoK2013.pdfでオンラインで入手できます。

[Gomez14] Gomez L. and Karatzas D.: マルチスクリプトおよび任意指向のシーンテキスト抽出のための高速階層的手法、arXiv:1407.7504 [cs.CV]。この論文は、 http://arxiv.org/abs/1407.7504でオンラインで入手できます。

score 1 · Accepted Answer

それを行うための簡単または単純なアルゴリズムは知りません。ただし、同様の動作を行うために、leadtools という名前のサードパーティツールキットを使用しています。テキストゾーンを自動的に見つけて認識できることを知っています。詳細については、コードスニペットを含む次のヘルプトピックを参照してください。

オートゾーン

また、画像の色によって OCR 認識プロセスの精度とパフォーマンスが低下するため、OCR の前に画像に画像処理を行うこともできます。

image - 画像内のテキストのローカリゼーションに適したアルゴリズムはありますか？

3 に答える 3

Related

Reference