MATLABで2Dオブジェクト認識を実装することについて何か考えがありますか?オブジェクトのどの特性がニューラルネットワークにフィードできますか?
1 に答える
オブジェクト認識は、一般に、すべての画像処理タスクの主要部分の 1 つです。指紋認識や最適な文字認識などの単純なケースから、動きの追跡などまで。
もちろん、与えられた問題を考慮して、さまざまなアプローチがあります。色にのみ基づくことができます(色ベースオブジェクト認識)。たとえば、緑色のフィールドに赤いボールがあるとします。緑色を検出するだけで、ボールを追跡する場合のようにボールを識別できます。もう 1 つの単純なアプローチはMorphological Operatorです。さらに、ヒストグラムを使用して、ピクセルの分布から、ここのように画像のすべてのエッジを見つけることができます。この方法は、書かれたテキストのベースラインを見つけるためにも使用されます。
より高度な方法は、機械学習アプローチに基づいています。ニューラル ネットワークは最もよく知られており、基本的に一連の例でモデルをトレーニングし、ニューロンの適切な重み/値を見つけ、最後にモデルに新しい例について判断するように求めます (テスト)。もちろん、画像をネットワークに送信するのは賢明ではありません。計算上の側面とは別に、過適合の問題があります。そのため、画像間で共通するパターンを抽出することは別の課題です。たとえば、すべての文字「A」が従うパターンは、曲線、角度、強度、FT 値であり、「L」などと区別されます。この部分は次元削減とも呼ばれます、すべての画像ピクセルをいくつかのデータポイントにマッピング/構成しているためです。PCA (主成分分析)を実行し、matlab でPCAとSVDを確認します。これらのメソッドは、いくつかの最も高いバリアント ベースでのみデータの変動を説明します。
最近注目されている機械学習のもう 1 つの視点は、オブジェクトを信号として、その他すべてをノイズとして見る統計的アプローチです。Gaussian ProcessとKernel Methodsはこちら側に配置されます。「Google でオブジェクト トラッキング」の横にあるこれらの用語を検索するだけで、何千もの学術論文を入手できます。
要するに、それは本当に一般的な質問です。問題に応じて、解決策を変更できます。あなたの質問は彼らの専門知識に適合する可能性があるため、https://stats.stackexchange.com/に目を通すことをお勧めします。