6

私は、車両の形状をスキャンし、それがどのタイプの車両であるかを検出しようとするプロジェクトを実行する必要があります。スキャンは、「車両スキャナー」と呼ばれるセンサーで実行されます。これらのセンサーは、わずか 50 の光のビームであり、各ビームには受容体と放出があります。写真に示されているように:

ここに画像の説明を入力

センサーから各ビーム (ブロックまたはブロック解除) の生の状態を取得し、その継続的なスキャンにより、車両のおそらく非常に低解像度の画像を作成できます。

私の質問は、車両の形状を検出して識別するためにどのようなアルゴリズム/手法を使用できるかということです。車輪を数えたいのですが、可能であれば、その形状が車なのか、トラックなのか、ピックアップなどなのかを識別しようとしています。少なくとも車輪を数えたい。

私はニューラル ネットワークのトレーニングを検討していますが、おそらく、この種のパターン検出には、私が使用できる、そして私が気付いていない、より単純なアプローチになる可能性があります。その他の提案/アドバイスは大歓迎です

4

3 に答える 3

5

標準的なニューラル ネットワークが妥当な選択であり、機能しますが、畳み込みニューラル ネットワーク (CNN)がおそらく最良の選択です (簡単な説明については、こちらを参照してください)。CNN は画像認識に最適です。疎な接続性によって空間的に局所的な相関が可能になるため(つまり、互いに近接した入力間の関係を考慮に入れるため)、標準的なニューラル ネットワークよりも効果的に新しいデータセットに一般化されます。トレーニングも速くなります。

車輪の数を検出するために、低解像度の入力をいくつかの重複する「車輪サイズ」のパッチに分割し、各パッチを車輪を検出するように訓練された CNN への入力として使用することができます。CNN が同じホイールの周りの複数のパッチに対して true を返す可能性があるため、ローカルの「true」パッチのそれぞれが合計カウンターの 1 つのインクリメントのみを引き起こすように、近接チェッカーを実装する必要があります。これは、出力ノードのアクティブ化が最も高いローカル パッチを特定し、このパッチの周囲にある他のパッチが合計カウンターに影響を与えないようにすることで実行できます。

事前に分類された車両画像の選択に基づいてトレーニングされた CNN に画像全体を供給することができるため、車またはトラックとして形状を識別することは、実際にはより簡単なタスクになります。トレーニング データセットをランダムな収縮/伸長変形で増強することにより、速度の収縮/伸長効果を回避することが可能です。CNN でパラメーターを設定する方法については、画像分類の畳み込みニューラル ネットワークのパラメーターをどのように決定するかを参照してください。

CNN がいかに効果的であるかの証明として、Large Scale Visual Recognition Challenge 2012 (LSVRC)の結果をご覧ください。LSVRC は、競合他社が 256x256 の画像を任意に選択して、最小の分類エラーを達成することを競う画像分類コンテストでした。Supervision という名前の優勝したネットワークは、CNN モデルを使用することで、競合他社のほぼ半分のエラーを達成しました。CNN はまた、多くのテキスト認識タスクで最高の精度の記録を保持しています。たとえば、モデルが 99.8% の精度を記録したMNIST 数字認識タスクなど、人間の認識率に匹敵する精度です。

于 2014-08-22T07:40:54.160 に答える