画像内のテキスト候補を検出する優れたテキストローカリゼーションアルゴリズムをご存知でしょうか(私のOCRプロジェクトの場合)
基本的に、このアルゴリズムを「適用」した後、文字候補を含む領域(バウンディングボックス)を取得できるようにしたいと思います。
私は自分が使うかもしれない何かを見つけようとしていますが、何かを見つけたとしても、それは非常に難しい論文で、適用する必要のある非常に高い数学を持っている可能性が高いです。私はすでにMSER(Maximally Stable Extremal Regions)またはGradient Vector Flowメソッドに遭遇しましたが、どちらも私には非常に困難です(数学では多くのことを理解していますが、これらを理解するのはまだ難しいです)