machine-learning - ニューラルネットワークを使用した OCR

Question

私は、OCR を実行するために NN の使用法を理解するために取り組んでいます。私の目標は、通常の OCR アルゴリズムとは少し異なります。

私の目的は、特定の入力が特定の文字であるかどうかを判断できるようにすることです。たとえば、ユーザーから文字「A」を取得することを期待しており、別の形状になっていないことを確認する必要があります。

与えられた入力が適切な形状であるかどうかを判断できる必要があります。

私が読んでいることから、ここにはいくつかのオプションがあります.MLP、SOMネットワーク、逆伝播ネットワークです。

私が理解したところでは、ネットワークをトレーニングするために形状 (文字) ごとにサンプルを作成する予定なので、SOM ネットワークを定義する必要があるということでよろしいですか?

どちらの方向が好ましいかわかりません。正しい方向に私を向けることができれば、それは素晴らしいことです。

Encog フレームワークを使用する予定ですが、それが重要かどうかはわかりません。

score 2 · Accepted Answer

あなたが説明したことから、SOM は教師なし分類器であるため、最良の選択ではありません。各トレーニング例のクラス (文字) を指定しています。したがって、多層パーセプトロン (MLP) などの教師あり分類器がより適切です。

MLP とバックプロパゲーションネットワークに関して、これはやや誤った区別です。MLP は人工ニューラルネットワーク (ANN) の一種ですが、バックプロパゲーションは学習方法です。MLP は、バックプロパゲーションまたは他の方法 (遺伝的アルゴリズムなど) を使用してトレーニングできます。

machine-learning - ニューラル ネットワークを使用した OCR