4

次の画像があり、二値化しています。</p>

ここに画像の説明を入力

この画像をセグメンテーションする必要があり、数字を認識しました。2 つの数字 4' と '9' が接続されています。

「流域形態」メソッドについて言及しているドキュメントをいくつか読みました。次の画像は「流域セグメンテーション」を実装しています。

ここに画像の説明を入力ここに画像の説明を入力

2 桁の44桁がまだ接続されていることは明らかですが、 9桁のセグメント化は成功しています。

44文字をセグメント化する方法を教えてください。ありがとうございます。

4

1 に答える 1

5

鄭春、

これは非常に難しい作業であり、私の意見では、すべての場合に完全に解決できるわけではないことを理解する必要があります。

そもそも、サイズと形状についての事前の知識がなくても文字を正しく分割することは不可能です。文字Wを考えてみてください。これは、2つのVに分割することができます。反対に、誤ってIJに触れた2つが、実際にはUではなく2つの異なる文字であるとは言えません。

これは、洗練されていても、流域やその他のような「ブラインド」方式は成功しないことを意味します。ジオメトリだけでは不十分です。フォントの説明(サイズと形状)に依存する必要があります。

私の知る限りでは、セグメンテーションと認識を連携させる必要があります。あなたができることは次のとおりです。

  • 最初のセグメンテーションを使用して、触れたり壊れたりする文字がそれほど頻繁に発生しないことを期待します。
  • 左から始めて、1文字の幅の後で分割して、すぐに文字認識を試してください(すべてのフォント文字を順番に試す必要があります。幅が異なる場合もあります)。
  • 最も可能性の高い認識結果を保持し、その分割から右側に認識を継続します。
  • 壊れた文字が予想される場合は、2つ以上のブロブにまたがる認識を試して、これらをグループ化することもできます。(ブロブ間のギャップは、キャラクターが壊れたりパーツを見逃したりする可能性がない限り、分割の良いヒントになります。)

ヒューリスティックを追加して、最小の高さなど、分割が発生する可能性が高い場所を決定することで、上記の手順を改善できますが、これには注意が必要です。黒魔術のピンチ...

于 2013-02-28T07:29:24.553 に答える