kinect - Kinect デプスカメラの精度

Question

Kinect の深度カメラの精度はどれくらいですか?

範囲？
解像度？
ノイズ？

特に知りたいのは：

マイクロソフトからの公式仕様はありますか?
この件に関する科学論文はありますか？
TechBlogs からの調査？
再現しやすい個人的な実験は？

現在、約 1 日分のデータを収集していますが、ほとんどのライターは情報源に名前を付けておらず、値はかなり異なっているようです...

score 26 · Accepted Answer

範囲：～50cm～5m。部分的に近づけることはできますが (~ 40 cm)、全体像を 50 cm 未満にすることはできません。
水平解像度: 640 x 480、垂直 FOV 45 度、水平 FOV 58 度。単純なジオメトリは、50 cm で x x x y のピクセルあたり約 0.75 mm であり、2 m で x x x y のピクセルあたり約 3 mm です。
深度分解能: 50 cm で ~ 1.5 mm。5mで約5cm。
ノイズ: すべての深さで約 +-1 DN ですが、深さに対する DN は非線形です。これは、近くに +-1 mm、遠くに +-5 cm という意味です。

Microsoft からではなく、センサー開発者からの公式仕様があります。私が知っている科学論文はまだありません。たくさんの調査と実験 (Google を参照)。OpenKinectでは、これらのことについて、今のところこのサイトよりも多くの議論があります。

score 12 · Accepted Answer

Kinect for Windows SDKは、私が使用していて一貫しているように見えるいくつかの定数を提供します。範囲と解像度の場合、これらの値は次のとおりです。

デフォルトモードの場合：

最小範囲：80cm
最大範囲：400cm

ニアモードの場合：

最小範囲：40cm
最大範囲：300cm

カラーカメラの場合、次のいずれかの解像度を使用できます。

80x60
320x240
640x480
1280x960

デプスカメラの場合、次のいずれかの解像度を使用できます。

80x60
320x240
640x480

Avada Kedavraからの（そして、ちなみに、ほとんどのソースからの）情報に直面して、APIによって与えられる視野の値は次のとおりです。

カラーカメラの場合：

水平視野：62,0°
垂直視野：48,6°

デプスカメラの場合：

水平視野：58.5°
垂直視野：45,6°

ソース： http： //msdn.microsoft.com/en-us/library/hh855368

score 7 · Accepted Answer

ここでの本当の問題は、分解能と精度に関するものでした。解像度と精度が記載されているほど良くないことがわかったので、ここにチップを入れたいと思います。深度解像度の最大出力は確かに 640x480 ですが、これは有効な解像度ではなく、精度も正確ではありません。

キネクトが機能する方法は、構造化された光の投影に基づいています。光のパターンが放出され、表面にキャストされます。これをカメラが確認し、原点からオブジェクトに跳ね返った各光線を三角測量してカメラに到達させます。

問題は、このパターンが三角測量できる 34.749 個の輝点だけで構成されていることです( http://azttm.wordpress.com/2011/04/03/kinect-pattern-uncovered/ )。これを 640x480=307.200 データポイントの解像度に関連付けると、大きな違いに気づきます。ソースデータポイントの量の 10 倍のデータ量が有効であり、効率的にサンプリングできるかどうかを自問してください。疑わしい。kinect の実効解像度は何かと聞かれたら、240x180 程度の正直でかなり良いデータだと思います。

score 5 · Accepted Answer

Kinect の技術仕様によると、深度フィールドの仕様が最終的に明らかになりました (これらの一致は、Mannimarco によって投稿された公式プログラミングガイドでも確認されています)。

* Horizontal field of view: 57 degrees
* Vertical field of view: 43 degrees
* Physical tilt range: ± 27 degrees
* Depth sensor range: 1.2m - 3.5m
* Resolution depth stream: 320x240 pixels
* Resolution color stream: 640x480 pixels

しかし、私自身の経験から、深度センサーの範囲は0.8m-4.0m. この範囲は、以下のコメントで mankoff によって投稿された Primesense データシートと一致します。

深さの解像度は、センサーに近い方が遠くにある場合よりもはるかに高いことを覚えておくことも重要です。3 ～ 4 メートルでは、解像度は 1.5 メートルほど良くありません。これは、たとえば、サーフェスの法線を計算する場合に重要になります。結果は、センサーから離れているよりもセンサーに近い方が良好です。

自分で範囲をテストするのは難しくありません。公式 SDK (現在はベータ版) では、範囲外にいる場合、ゼロ (0) の深度が得られます。したがって、単純な定規でこれをテストし、ゼロより大きい読み取り値が得られる/得られない距離をテストできます。OpenKinect SDK が範囲外の読み取りを処理する方法がわかりません。

ノイズについてのコメント: 深度ストリームにはかなりのノイズがあり、作業が難しくなっています。たとえば、表面法線を計算すると、それらが少し「ぎくしゃく」することが予想されます。これはもちろん、偽の照明などに悪影響を及ぼします。さらに、IR 送信機間の距離が原因で、深度ストリームに視差の問題があります。そして受信機。これは、深度データに大きな「影」を残すため、操作が難しい場合もあります。この youtube ビデオでは、問題を示し、シェーダーを使用して問題を解決する方法について説明しています。見る価値のあるビデオです。

score 2 · Accepted Answer

2012 年 2 月に kinects 深度センサーの理論的ランダムエラーモデルを提案した Khoshelham と Elbernik の論文に言及する価値があると思います。「インドアマッピングアプリケーションの Kinect 深度データの精度と解像度」と呼ばれています。論文はここで見つけることができます。

score 1 · Accepted Answer

Microsoftが公開しているものをお探しの場合は、Kinectプログラミングガイドの11ページをご覧ください。ここの誰もがすでに述べたのとほとんど同じことを言っています。

範囲：1.2〜3.5メートル
視野角：垂直43°×水平57°
機械化された傾斜範囲：±28°
フレームレート：毎秒30フレーム
解像度、深度ストリーム：320 x 240（実際にはこれより高くなる可能性があります）
解像度、カラーストリーム：640 x 480（ここでも高くなる可能性があります）

ノイズについて言及しているものは何もありませんが、それがより目立つようになる可能性のある表面の端に沿っていることを除いて、それはかなり最小限であると言えます。

score 1 · Accepted Answer

私の経験では、それはそれほど正確ではありません。かなり問題ありませんが、巻尺と比較すると、正確には一致しません。私は 10mm ごとの測定値で Excel を作成しましたが、特に 2500mm を超えて離れているものと、それよりも近いものには耐えられません。

また、実際の深度ピクセルは、宣伝されているよりもはるかに低いことに注意してください。内部の電子機器が隙間を埋めるため、ピクセルデータのようなものではなく、小さな領域のアーティファクトが表示されます。本質的に、これは 320x240 の 1/8 ピクセルが「実際の」測定でカバーされ、他のピクセルが計算されることを意味します。したがって、640x480 を使用できます。ただし、それは CPU/UBS リソースのみであり、アプリケーションの見栄えは良くなりません。

これは私の 2 セントの経験にすぎません。私はロボット工学をプログラミングしています。

kinect - Kinect デプス カメラの精度

7 に答える 7

Related

Reference

kinect - Kinect デプスカメラの精度