私は OpenCV と Python を使用しています。
この車のシーケンスビデオがあるとしましょう。cv2.goodFeaturesToTrack
そして、とを使用して、車のいくつかの「興味深い点」を追跡しましたcv2.calcOpticalFlowPyrLK
。ここで、トレースされたポイントを考慮して、車の非常に大まかな形状 (おそらく 3D ボックス) とカメラからの距離を推定したいと思います。それほど正確である必要はありません。
その上で、リアルタイムで更新し続けたいと思っています。私が達成しようとしていることを理解できる最も近い YouTube ビデオは、これです。OpenCV で新しいStructure from Motion モジュールを見つけましたが、これはポイントのコレクションから 3D モデルを構築するためのものです。
問題は、これを達成するための最良の方法と、(特に 3D 空間を構築するために) どの種類のライブラリを使用できるかということです。
また、何らかの形でこれに C++ を使用する必要がある場合も問題ありません (ただし、まだ得意ではありません)。
ありがとう。