2

画像のパターン検出を正しく行う方法またはその他のニューラル ネットワークがあるとします。画像に複数のパターンがあるニューラル ネットワークをどのように設計すればよいですか?

画像に X パターンが検出されるとします。最善のアプローチは何でしょうか? 私の知る限り、出力層のニューロンの値は [-1,1] である必要があります。X 個のパターンが認識されているかどうかは、どうすればわかりますか? これは、認識できるパターンの数にハードコードされた制限を設定する必要があるということですか (出力ニューロンの数が固定されているため)。

4

3 に答える 3

0

これを行うには、hopfild ネットを使用します。最初に等しいウィンドウでターゲットを抽出し、ネットに保存します。次に、画像内の単純なアルゴリズム検索を使用して、いつでもネットのシムをターゲットと比較し、ターゲットに対して別の配列を使用して結果を保存します。最後に、各配列で最も近いパターンを抽出します。いくつかの画像を使用できます開始する前に元の画像を処理します。

于 2011-01-16T10:58:57.540 に答える
0

はい、これはニューラル ネットワークで実行できます。最も実用的な解決策は、画像をスキャンするウィンドウにニューラル ネットワークを適用することだと思います。ニューラル ネットワークからの複数のヒットは、画像内の複数のターゲット オブジェクトを意味します。

ちなみに、ニューラル ネットワークは -1 .. 1 の範囲内にある必要はありません。

于 2011-01-20T19:05:30.487 に答える
0

例として顔検出を使用した提案を次に示します。Github のこの顔検出リンクは、Haar Classifier を使用して倍数パターン (つまり、顔) を検出するように説明されています。実装セクションの下を読むと、アルゴリズムがパラメーター (とりわけ) を使用して、画像内で検出される顔の数を制御するscaleOptionことが述べられています。templateSizeOption特定の画像のサブスペースまたはウィンドウ内の機能を探す必要があるように思えます (おそらく重複するスペースも)。

scaleOption - このパラメーターは、顔検出に使用される haar 特徴がスケーリングされるレートを指定するために使用されます。スケール オプションを小さくすると、より多くの顔が検出されることを意味します。スケール オプションを大きくすると検出が高速になりますが、入力画像から一部の顔を見逃す可能性があります。デフォルトのスケール値は 1.1 で、各ステップでフィーチャ ディメンションが 10% 増加することを決定します。

templateSizeOption – 顔を検索する最小領域を指定するために使用されます。クローズアップ画像から人物を検出する場合、サイズは 40 ピクセル以上にする必要があります。それ以外の場合は、多数の顔を検出するには 25 領域ピクセル (デフォルト値) で十分です。

于 2011-01-06T14:41:09.653 に答える