私は、オブジェクト認識プログラムに使用する適切なアルゴリズムについて多くの検索を行ってきました。しかし、私が見つけたものにはすべて、いくつかの大きな欠陥がありました。
私のプログラムは、オンラインで新しいオブジェクトに遭遇したときにそれらを学習することになっています。新しいオブジェクトに遭遇すると、ボックスがその上にバインドされ、オブジェクトが学習されます(OpenTLDはこれを完全に実行します)。さまざまなオブジェクトに対してこれを数千回繰り返すと、プログラムは数千のクラスとオブジェクトのインスタンスを認識できる必要があります(Haarのような機能カスケードはこれを行うことができ、OpenTLDは失敗します)。アルゴリズムは、スケールと方向が不変である必要があります(Haarは失敗します)。
私が見つけたものはすべて、上記の基準の一部しか満たすことができず、残りは失敗しました。驚いたことに、私はまだすべての基準を満たすことができるものに出くわしました。HaarとOpenTLDは、私が必要としているものに最も近いものであるため、上記でのみ言及します。SIFT、SURFのような他のアルゴリズムは、私が必要としているものからさらに遠く離れています。
だから私の質問は、私が必要なことをする既存のソースコードはありますか?それとも、これは既存のソースコードを変更するだけで幸運が得られるものですか?