0

筆記体(正確には医師の筆跡)を読み取るアルゴリズムを開発しようとしています。すべての文字を一致させる必要はなく、認識可能な文字だけを一致させる必要があります (辞書のアプローチを使用しています)。

今のところ、BufferedImageクラスに二値化された画像があります。次に行う必要があるのは、各キャラクターを分離することです。

どうすればこれを達成できるかについての疑似コードを教えてもらえますか? 他のライブラリの使用は最小限にしたいと思います。それぞれのプロセスがどのように達成されるかを学ぶことで、これを実現したいと考えています。ヒントはありますか?

4

2 に答える 2

2

画像が回転またはスケーリングされている場合でも、画像を比較するために使用できる画像モーメントなどについて学ぶ必要があります。

それを行う方法を理解するには、数学の深い背景が必要です。このhttp://www.ias.ac.in/sadhana/Pdf2007Oct/521を読むことから始めることができます。これは、特定の種類の文字の OCR (カンナダ語) が実装されている場合、同じ一般原則があなたがやろうとしていることに適用されるべきです

この追求に数か月 (または数年) を費やすつもりがない場合は、ocropusjavaocrなど、既に利用可能なものを使用することをお勧めします。

于 2012-07-08T06:01:34.807 に答える
1

または、Vision Objects から HWR SDK を購入することもできます。これにより、開発の労力が大幅に削減されます。

于 2012-07-09T01:20:32.367 に答える