2

これらの商用製品のロゴ(これらは単なる画像)をデータベースにすべて持っていて、現実の世界でこれらのロゴの写真を撮るとします。プログラムが写真からそのようなロゴを検出できるようにするにはどうすればよいですか?制約は次のとおりです。

たとえば、サッカー選手がコカ・コーラのロゴが入ったシャツを着ていて、シャツ全体にシワがあり、ロゴが歪んでいる可能性があります。これがどのように見えるかの例です。左側はオリジナルで、右側は歪んだバージョンです。

ロゴテストC

もう1つの例は、まっすぐ前の通りの写真を撮った場合です。写真では、歩道にマクドナルドの看板があり、写真の観点からすると、歩道のこのマクドナルドのロゴは右側の「M」のように見えます。左側の「M」は元の画像です。

ロゴテストM

したがって、これらの制約を考慮すると、ロゴは現実の世界では何らかの形で歪んで見える可能性がありますが、もちろん、写真のロゴが私たちが理解できないほど歪んでいる場合、それは範囲外です。しかし、ロゴのオリジナルの「香り」があれば、それは可能であるはずですよね?

この場合、写真のロゴをどのように検出できますか?私が探しているべきアルゴリズムや方法のいくつかは何ですか?

4

1 に答える 1

2

これは、機械学習タスクのようなものです。できるだけ歪んだビューでロゴのいくつかの例の画像を取得します。次に、オブジェクト検出器をトレーニングして、ロゴを見つけます。

あなたが考慮したいと思うかもしれないこと

  • これを行うには、多くのトレーニングデータが必要になります。十分なトレーニングデータを取得するために、合成(ミラーリングされた)歪みを生成することをお勧めします

  • オブジェクト検出に関する文献には、さまざまなアルゴリズムが豊富に含まれています。箱から出してすぐに機能するソリューションはありません。いくつかのアルゴリズムを試してみてください。まずは単語の袋、つまりSVMから始めます。

  • 画像内のロゴを見つけるには、おそらく「スライディングウィンドウ」検出スタイルを実行する必要があります。ロゴは、大量のデータで検出したい2Dパターンと考えてください。

幸運を!

于 2012-09-01T23:02:54.530 に答える