4

私は、オブジェクト認識プログラムに使用する適切なアルゴリズムについて多くの検索を行ってきました。しかし、私が見つけたものにはすべて、いくつかの大きな欠陥がありました。

私のプログラムは、オンラインで新しいオブジェクトに遭遇したときにそれらを学習することになっています。新しいオブジェクトに遭遇すると、ボックスがその上にバインドされ、オブジェクトが学習されます(OpenTLDはこれを完全に実行します)。さまざまなオブジェクトに対してこれを数千回繰り返すと、プログラムは数千のクラスとオブジェクトのインスタンスを認識できる必要があります(Haarのような機能カスケードはこれを行うことができ、OpenTLDは失敗します)。アルゴリズムは、スケールと方向が不変である必要があります(Haarは失敗します)。

私が見つけたものはすべて、上記の基準の一部しか満たすことができず、残りは失敗しました。驚いたことに、私はまだすべての基準を満たすことができるものに出くわしました。HaarとOpenTLDは、私が必要としているものに最も近いものであるため、上記でのみ言及します。SIFT、SURFのような他のアルゴリズムは、私が必要としているものからさらに遠く離れています。

だから私の質問は、私が必要なことをする既存のソースコードはありますか?それとも、これは既存のソースコードを変更するだけで幸運が得られるものですか?

4

1 に答える 1

4

TLD と Kalal の作品は追跡に優れています。しかし、認識は非常に異なる問題です。

SIFT や SURF を認めない理由がわかりません。私は間違いなくその方向を見るでしょう。Histograms of Oriented Gradients (HoG) ( Wikipedia ) は、最新技術と見なされるアルゴリズムの関連ファミリーです。たとえば、多くの ICIP'11 論文で何らかの形で使用されています。

あなたが求めているのは、コンピューター ビジョンではまだほとんど解決されていない問題です。すぐに使えるコードはあまりありません。非営利目的のコード (Matlab など) を調査します。Pongr、Kooaba、IQEngines などの一部の企業は、オブジェクト認識用のオンライン API を提供しています。

于 2012-03-18T13:08:20.487 に答える