通常の拡張現実の実装について考えてみてください。1つ以上のマーカーがあり、ソフトウェアはマーカーを認識し、通常はそれらの上に何かを表示します。
最初の部分だけに興味があります。写真に特定のマーカーが存在するかどうかを判断するには、アルゴリズム、コンポーネント、フレームワーク、またはクラスが必要です。
どこから始めればいいですか?私はJavaまたはC++のコンポーネントを好みますが、これらの言語に制限されません。
通常の拡張現実の実装について考えてみてください。1つ以上のマーカーがあり、ソフトウェアはマーカーを認識し、通常はそれらの上に何かを表示します。
最初の部分だけに興味があります。写真に特定のマーカーが存在するかどうかを判断するには、アルゴリズム、コンポーネント、フレームワーク、またはクラスが必要です。
どこから始めればいいですか?私はJavaまたはC++のコンポーネントを好みますが、これらの言語に制限されません。
opencvの検出器:機能検出(例として、 opencvパッケージに同梱されているfind_obj.cppサンプルがあります)が表示されるはずです。最も人気のあるアルゴリズムは、ARToolKitで説明および実装されています(グーグルで検索してください)。
これが役立つかどうかはわかりませんが、Javaの場合はZXingを参照してください。これはバーコードリーダーライブラリですが、QRコードを読み取るタスクは、バーコード内の3〜4個のマーカーを認識することになります。そのアプローチは再利用可能であることがわかるかもしれません。
OpenCV for C ++(Pythonバインディングもあります)から始めるのが良いでしょう。
基本的に、ビデオを通じてオブジェクトを追跡する必要があります。OpenCVでこれを行うには、モーション分析とオブジェクトトラッキングのページで説明されているいくつかの方法があります。