4

レンダリングされた3次元デジタルムービーから特定のオブジェクトまたはモデルを認識できるようにする必要があるという考えがありました。

限られた調査の結果、私が必要としているのは、コンピュータビジョンの分野での特徴検出と呼ばれるものであることがわかりました。

だから、私がしたいのは:

  1. 映画の特定のキャラクターのスクリーンショットをいくつか作成します(例:front / back / leftSide / rightSide)
  2. 映画を再生する
  3. 映画の再生中に、映画の新しいスクリーンショットを継続的に作成します
  4. スクリーンショットごとに、機能検出(SIFT?、openCV?を使用)を実行して、キャラクターの外観が存在するかどうかを確認します(キャラクターが遠くにあるために小さく見える場合、またはキャラクターが嘘をついている場合は、それらを認識しなければなりません。下)。
  5. キャラクターが見つかったら通知します

これはOpenCVで可能ですよね?

「問題」は、このアプリケーションを開発するためにc++またはpythonを学ぶ必要があるということです。私の映画とスクリーンショットが私がやりたいことに適用できるのであれば、これは問題ではありません。

そこで、最初に映画のスクリーンショットをテストしたいと思います。テストデータを入力し、プロトタイピングの手段としてその機能検出アルゴリズムを手動で実行できるOpenCVのGUIバージョンはありますか?

フィードバックをいただければ幸いです。ありがとう。

4

5 に答える 5

4

あなたが望むことをすることができるOpenCVのGUIはありません。問題のいくつかの側面にOpenCVを使用することはできますが、そこで待っている既成の解決策はありません。

あなたの問題を解決することは間違いなく可能ですが、この問題の学習曲線はかなり長いです。あなたが専門家であるならば、それについて自分で学ぶ代わりに、あなたのためにそれをするために専門家を雇うことでしょう。お金がかかりますが、時間を節約できます。

編集

テンプレートマッチングに関しては、通常、このような問題を解決するために使用することはありません。探しているのは外観と形状を変更することだからです。「設定する動的パラメータ」は実際にはありません。あなたが試すことができる最も近いことは、あなたのターゲットがとるかもしれない予想される形をカバーしようとするであろう大規模なテンプレートコレクションを持つことです。しかし、それはエレガントな解決策にはなりません。さらに、それはスケーリングしません。

次に、顔認識についてのあなたのポイントに。これは一種の関連性がありますが、ほとんどの顔認識アプリケーションは、照明、距離、ポーズ、角度などの制御された環境を扱います。その制御された環境の外では、顔検出の有効性が大幅に低下します。映画内のオブジェクトを検出している場合、環境は実際には制御されていません。

最初に、キャラクターが誰であるかを判断せずに、キャラクターがどこにいるかを正確に検出するという、より単純な問題を試してみることをお勧めします(基本的にビデオ監視)。単純に聞こえるかもしれませんが、実際には任意のシーンにとって重要であることがわかります。その問題を解決した結果は、キャラクターを識別するのに役立つかもしれません。

于 2011-01-31T02:28:29.543 に答える
2

そうですね、OpenCVを使用すると、ビデオファイルのフレームを取得して計算を行うことになります。

その画像でキャラクターを検出する方法はいくつかありますが、柔軟性を持たせるのはそれほど簡単ではないため、たとえば、立っているキャラクターの参照画像のみを入力した場合など、床に横たわっている場合でもその人物を取得できます。 。

基本的に、参照画像のセットからすべての重要な特徴を抽出してみて、分類のためにその文字の優れた特徴ベクトルを取得する(あなたの場合は教師あり)学習アルゴリズムを使用することができます。

次に、ビデオを再生し、ビデオフレームを取得するコードを作成する必要があります。たとえば、500ミリ秒ごと(または必要に応じて他のフレーム)を取得し、そのキャラクターとなるオブジェクトのセグメンテーションを取得して、取得した参照値と比較します。あなたの学習アルゴリズムから。一致するものがある場合、コードは「Yehaaawww!」と叫ぶことができます。または他のことをします...

しかし、これはすべて、これをどれだけ柔軟にするかによって異なります。テンプレートの一致または相互相関を試すこともできます。これは、基本的に参照画像をフレーム上でシフトし、両方の部分がどれだけ等しいかをチェックします。しかし、残念ながら、これは回転、変形、またはその他のノイズに非常に敏感です...そのため、その人が横になっていると、その人を捕まえることはできません。そして、私はあなたがそれらすべての計算をリアルタイムで行うことができるとは思えません...

基本的に:はいOpenCVは、画像処理/コンピュータービジョンタスクに使用するのに適しています。しかし、それは多くの方法と方法を提供し、あなたはあなたの画像のために働く方法を見つける必要があるでしょう...しかしそれは簡単な仕事ではありません...

お役に立てば幸いです...

于 2011-01-30T23:10:20.180 に答える
2

MathieuLabbéによるFind-Objectがあります。ビデオの実行中に記述子を変更して何が起こるかを確認できるため、記述子を理解し始めるのに非常に役立ちました。

これはおそらく手遅れですが、他の誰かが解決策を探すのに役立つかもしれません。

于 2012-06-02T13:55:20.237 に答える
1

オックスフォードビジュアルジオメトリグループの作品のいくつかを見てみましたか?

彼らのビデオグーグルシステムは、あなたが望むもの、インスタンス検出を大部分説明しています。

テレビ番組で人々に名前を付けることへの彼らの仕事もかなり関連しています。Matlabから実行できる顔検出と顔の特徴のパイプラインが含まれています。Matlabに精通していますか?

于 2011-03-09T13:31:18.880 に答える
1

Cassandraのようなコンピュータビジョンフレームワークを試しましたか?そこでは、マウスを数回クリックするだけでそれを正確に行うことができます。

于 2015-01-05T09:06:22.183 に答える