手描きの図でオブジェクトとテキストを検出しようとしています。
私の目標は、このようなものをオブジェクト構造に「解析」して、さらに処理できるようにすることです。私の最初の目的は、テキスト、線、ボックスを検出することです(矢印などは重要ではありません(今のところ;))
Dilatation、Erosion、Otsu thresholding、Invert などを実行でき、このようなものに簡単に到達できます
ガイダンスが必要なのは、次のステップです。私はいくつかのアイデアを持っています:
- 輪郭分析
- UNIPENを使用したOCR
- エッジ検出
輪郭分析
ボックスなどを認識するのに最適な方法である可能性があるCodeProjectの「C#での画像認識のための輪郭分析」について読んでいますが、私の問題は、ボックスが接続されているため、テンプレートと一致する個別のオブジェクトを形成しないことです。したがって、これが実行可能な方法である場合は、いくつかのアドバイスが必要です。
UNIPENを使用したOCR
UNIPEN (CodeProject の「マルチ ニューラル ネットワークを使用した大規模パターン認識システム」を参照) を使用して、手書きの文字を認識し、ボックスと線のみを残して画像から「削除」したいと考えています。
エッジ検出 もう 1 つの方法は、すべての線と角を検出し、その方法で画像を構成するボックスと線を推測することです。その場合、線をまっすぐにして 90 度の角を見つける方法についてのアイデアが役立ちます。
一般的に、コードサンプルではなく、どの戦略を適用するかについてのいくつかの指針が必要だと思います(ただし、それは素晴らしいでしょう;))