1

相関を使用して、Matlab で基本的な OCR システムを作成しました。(これはプロのプロジェクトではなく、演習としてのみ使用されており、Matlab の ocr() 関数は使用していません)。私のコードは、きれいなテキスト画像に対してほぼ正しく機能しています。しかし、仕事を少し難しくすると (テキスト写真を角度付きで横向きに撮る)、私のコードは良い結果をもたらしません。テキストを正しく配置するために主成分分析を使用していますが、これを行うと (角度を付けて写真を撮る)、文字が非常に接近していて、認識プロセスのためにそれらを分離することができません。

元の画像と前処理 (適応しきい値処理、調整、PCA) 後

元の画像と前処理 (適応しきい値処理、調整、PCA) 後

文字を正しく区切るにはどうすればよいですか?

4

2 に答える 2

-1

文字の分割はかなり難しい問題です。

文字の幅が一定でない限り (この画像の場合はそうですが、他の文字には当てはまらない可能性があります)、射影分析 (横座標の関数としての文字の垂直範囲) に基づく方法は失敗します。

実際、メソッドが効果的であるためには、フォントを認識している必要があります。つまり、アルファベットがどのように見えるかを事前に知っている必要があります。つまり、セグメンテーションを認識から切り離すことはできません。

可能性としては、接触する文字で構成されていると想定されるブロブを分解し (おそらく投影または既知の文字サイズに基づいて)、認識を実行し、認識結果を確認することを試みます。できれば、いくつかの分解を試して、最良のものを維持してください。

于 2017-10-03T09:52:25.853 に答える