私は、OCR を実行するために NN の使用法を理解するために取り組んでいます。私の目標は、通常の OCR アルゴリズムとは少し異なります。
私の目的は、特定の入力が特定の文字であるかどうかを判断できるようにすることです。たとえば、ユーザーから文字「A」を取得することを期待しており、別の形状になっていないことを確認する必要があります。
与えられた入力が適切な形状であるかどうかを判断できる必要があります。
私が読んでいることから、ここにはいくつかのオプションがあります.MLP、SOMネットワーク、逆伝播ネットワークです。
私が理解したところでは、ネットワークをトレーニングするために形状 (文字) ごとにサンプルを作成する予定なので、SOM ネットワークを定義する必要があるということでよろしいですか?
どちらの方向が好ましいかわかりません。正しい方向に私を向けることができれば、それは素晴らしいことです。
Encog フレームワークを使用する予定ですが、それが重要かどうかはわかりません。