3

私はテレビチャンネルを認識するプロジェクトに取り組んでいます。背景を避けてロゴの中央からサンプルを撮ろうとしているチャンネルの写真を撮っています。私は4つの異なるロゴを認識しています。テンプレートは次のとおりです。

Channel1 Channel2Channel3Channel4

テンプレートマッチングアルゴリズムはどのように機能しますか:
サイズが100x100の4つのテンプレートがあり、それぞれが異なるTVチャンネルを表し、それぞれが異なるしきい値(確率)を持っているとします。ユーザーがテレビからロゴをキャプチャしている場合、アルゴリズムは次のようになります。-各テンプレートで4つの独立したテンプレートマッチングを実行して、キャプチャされた画像と各テンプレートが一致する確率を受け取ります。-すべてのチャネル確率について、チャネルの確率がチャネルのしきい値よりも低い場合、確率は0に変更されます。-認識されたロゴが最も可能性の高いものであることを発表します。すべての確率が0の場合、「認識なし」をアナウンスします。

たとえば、確率が0.85でしきい値が0.9の1つのチャネルと、確率が0.8でしきい値が0.75の2番目のチャネルを取得した場合、2番目のチャネルが「勝ち」ます。

いずれかのロゴの写真を撮ると、95%の確率で写真が認識されます。

現在の結果:

  • 最初の(「笑顔」のロゴ)を検出しようとすると、10回の検出のうち10回の正しい検出が得られました。正しいテンプレートと画像の間のテンプレートマッチングでは、0.91から0.94の間の確率が得られます。他のロゴについては、0.77から0.91の間の確率が得られます。
  • 2番目(「緑」のロゴ)を検出しようとすると、10回の検出のうち10回の正しい検出が得られました。正しいテンプレートと画像の間のテンプレートマッチングでは、0.78から0.91の間の確率が得られます。他のロゴの場合、0.71から0.83の確率が得られます(ただし、しきい値が高いため、検出は成功します)。
  • 3番目(「丸い」ロゴ)を検出しようとすると、10回の検出のうち9回の正しい検出が得られました。正しいテンプレートと画像の間のテンプレートマッチングでは、0.83から0.92の間の確率が得られます。他のロゴについては、0.73から0.91の間の確率が得られます。
  • 4番目(「白黒」ロゴ)を検出しようとすると、10回の検出のうち10回の正しい検出が得られました。正しいテンプレートと画像の間のテンプレートマッチングでは、0.91から0.94の間の確率が得られます。他のロゴについては、0.78から0.92の間の確率が得られます。
  • 「ネガティブ」な画像を検出しようとすると、ロゴが検出されることがよくあります(これは悪いことです)。たとえば、完全な白いシートの画像を撮ると、0.9を超える確率で、1番目、3番目、4番目のロゴが検出されます。

「ネガティブ」画像でより良い結果を得るために、アルゴリズムを改善または変更するにはどうすればよいですか?

助けてくれてありがとう、

Eyal

4

1 に答える 1

3

それはすべて、テンプレートからチャネル確率を計算する方法によって異なります。色のヒストグラムまたはグラデーションのヒストグラムを使用していて、テンプレートとテスト画像のヒストグラムの違いを確認していますか?

別のアプローチは、勾配のヒストグラムと色のヒストグラムの連結など、テスト画像から特徴ベクトルを計算することです。次に、トレーニングデータベースを手動で作成します。このデータベースでは、ラベル(画像に表示されているラベルに応じて、1、2、3、または4)がわかっており、ハードコードされたラベルをヒストグラム機能とともににフィードできます。分類ルーチン。これにはLIBSVMをお勧めします。また、scikits.learnの実装はPythonで簡単に使用できます。

これにより、新しい画像の特徴ベクトルをトレーニングセットのサポートベクトルと比較し、画像に存在する可能性が最も高い適切なラベルを決定するサポートベクターマシン分類器が生成されます。次に、予測されたラベルだけでなく確率を生成するものが必要な場合は、このSVMの上にロジスティックモデルを適合させることができます。

このタイプの機械学習を始めるために読むべき2つの良い本は、Duda、Hart、およびStorkによるパターン分類とBishopによるパターン認識と機械学習です。

PythonでPoseletsとHistogramofOriented Gradientsを実装するために作成したいくつかの厄介なPythonコードは、ここにリンクされています。たぶん、そこにあるコードのいくつかのセクションをつかむことができ、それはあなたのタスクに適しているでしょう。

于 2012-03-18T02:00:23.890 に答える