2

最初の私の最終目標は、次の画像をtesseractで処理することです。http: //ubuntuone.com/72m0ujsL9RhgfMIlugRDWP (2番目と3番目の列を消去しました...)

ただし、正八胞体には点線の背景に問題があります。だから私の考えは、OpenCVで画像を前処理することです。偶数の線とは異なるしきい値を適用して点線の背景を削除する必要があるため、各線を何らかの方法で検出できれば最適です。私の問題を解決するための解決策はありますか?これまでのところ、ハフ変換とおそらくセグメンテーションを見つけましたが、結果はあまり良くありませんでした(おそらく間違ったパラメーターのため)...しかし、これらが可能なアプローチであるかどうか、そして私が最も時間を費やすものかどうかはわかりません。2番目の列には数字と3番目の文字のみが含まれているため、列の検出も問題ありません。この「知識」をtesseractに渡すと、検出率がさらに向上する可能性があります。

誰かがこの問題を解決する方法と、どのOpenCV関数がどのパラメーターで最もよく使用されるかについて、いくつかのヒントを教えてくれたら本当にありがたいです。さまざまな手順についての公正なアイデアを私に与えるいくつかのスニペットも役立ちます。

少し早いですがお礼を!!!

敬具。

4

1 に答える 1

0

文字の幅に比べてドットがかなり小さいように見えるので、侵食のようなものを使用することをお勧めします.

または、ドットのかなり短くて薄いエッジを破棄するように、適切なしきい値を使用して Canny エッジ検出を行います。

これが役立つことを願って、楽しんでください!

于 2012-02-11T12:10:58.217 に答える