3

画像の一般的なテキスト解析アルゴリズムを構築しています。私は走っていた:

MSER.detectRegions()

findContours(...cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

バイナリ イメージで。結果は同じです。MSER はグレースケールで実行できることは知っていますが、より安全にしたかったのです。

それらのいずれかを選択する必要がありfindContours()、実行時間MSERは半分以下です。

何か不足していますか?あなたなら何を選びますか?

4

1 に答える 1

4

既に指摘したように、バイナリ イメージで MSER を計算しても意味がありません。MSER は基本的に、増加する (減少する) しきい値を使用して画像 (グレースケール) を複数回しきい値処理し、得られるものは、ここのようないわゆるコンポーネント ツリーです。少なくとも異なる 2 値化でサイズ/形状が変化する連結成分は、いわゆる最大安定極値領域 (例: 概略図の K) です。もちろん、これは非常に単純化された説明です。詳細については、Google に問い合わせてください。十分な情報が見つかります。

ご覧のとおり、既にしきい値処理された画像をしきい値処理することは意味がありません。そのため、代わりにグレースケール イメージを MSER アルゴリズムに渡します。MSER は、最先端のテキスト検出アプローチの一般的な基盤です (ここここを参照)。

于 2016-09-15T10:30:53.733 に答える