c++ - 画像上の文字の開始と終了のXYベクトルを識別する

Question

ニューラルネットワークである種のOCRを開始するために、手紙に関するいくつかの情報を思い出そうとしています。私はまだすべてのものを実際に結合していませんが、私が今抱えている問題は、文字をどのように区別し、それらを分離するかです。http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJのようなもの（派手なものはなく、一般的なフォントのみ）

より良い方法は、各文字と数字が互いに結合する黒いピクセルを持っていることを考慮して、トップ、ローワーのxとyを取得するために大量のforループを作成することだと思います（ただし、iは例外です）。

これを支援できるライブラリやアルゴリズムはありますか？画像処理にCimgを使用しています。

これは本当に難しいですか？

score 1 · Accepted Answer

連結成分ラベラーを探しているようです。アイデアは、互いに接続されているピクセルのグループの画像をスキャンし、オブジェクトのコレクション (通常は「ブロブ」と呼ばれます) を返すことです。各オブジェクトには、そのブロブ内のピクセルのリストが含まれています。

自分で書き込もうとすることはお勧めしません。OpenCVには、非常にうまく機能し、に基づいているものが組み込まれています

F.Chang、C.-J.Chen、および C.-J.Lu 共著「等高線追跡技術を使用した線形時間コンポーネントラベル付けアルゴリズム」、Computer Vision and Image Understanding、vol. 93、いいえ。2, pp. 206–220, 2004.

特に文字を見つけることに特化した、より良い解決策があるかもしれません。

score 0 · Accepted Answer

OpenCVプロジェクトをチェックアウトしましたか? これは、数値OCRを行うためのチュートリアルです。

c++ - 画像上の文字の開始と終了のXYベクトルを識別する

2 に答える 2

Related

Reference