現在、SLAM アルゴリズムに取り組んでおり、深度と RGB データを点群の形で収集することに成功しました。ただし、Kinect 2.0 が受信したフレームのみを画面に表示するだけです。
これらのフレームを収集したいと思います。Kinect を動かしながら、より精巧なマップ (2D または 3D) を作成し、ローカリゼーションやマッピングに役立てたいと考えています。
マップの構築に関する私の考えは、多くの単一のスナップショットからパノラマ画像を作成するときと同じです。
誰でもそれを行うための手がかり、アイデア、またはアルゴリズムを持っていますか?