OCR プログラムで、結合またはオーバーラップしたテキストのセグメント化に問題があります。Times New Roman フォントを扱っています。このフォントでは、fb、fh、fi、fj、fk、fl などの文字が上部で結合されています。(下の写真を参照)。これは主にセリフ フォントで見られます。
Times New Roman フォントで結合された文字と流域アルゴリズムの結果:
明らかに、輪郭検出により、これらの 2 つの文字が 1 つのセグメンテーションになります。そこで、流域アルゴリズムを試してみました。上の写真でわかるように、オーバーラップは検出されますが、それ自体に別の問題があることがわかりました。文字「f」の細い部分も別のセグメントに分割されていますが、「f」全体が必要です。これは、使用しているマーカーのせいだとわかっています。(下記参照)
流域に使用しているマーカー:
また、重複部分にのみ流域アルゴリズムを適用できるように、文字の重複があるかどうかを検出する方法を知っている人はいますか。
では、この問題を解決するにはどうすればよいでしょうか。これを解決するために正しい方法、つまり流域を使用していますか? これに対するより良い解決策を知っている人はいますか?