私は、コンピュータ ビジョン技術を使用してクールなことを行う Web サイトを構築しています。ビデオはライブで録画され、ユーザーが Web カメラを使用してアップロードします。このためには、カメラの固有パラメーターと歪みパラメーターが必要です。ユーザーがアップロードしたビデオを考慮して、これらを計算する最良の方法を見つけようとしています。ユーザーがどのような動画をアップロードするかについては推測できませんが、合理的な推測としては、動画に人間が映っている可能性があります。私はまだこれの初期段階にありますが、他の人がこの問題をどのように解決したかを知りたいです。
具体的には、グループの経験豊富な人にコメントしてもらいたい質問を以下に示します。
- 市場で入手可能な一般的な Web カメラの固有パラメータと歪みパラメータを抽出するために、どのようなアルゴリズム、ライブラリ、および手法を利用できますか? [「抽出」と言い、「キャリブレーション」ではなく、固有パラメーターがキャリブレーションを必要としない単なるメソッド呼び出しである場合を含めます]。
- 一般的に、市場で入手可能な Web カメラの固有パラメータと歪みパラメータには、どの程度の差異が見られますか? それらを単一の固有パラメータと歪みパラメータで近似しましたか、またはどのようなアプローチに従いましたか?
- これらのシナリオで使用できるカメラのセルフ キャリブレーション方法はありますか? 役立つ可能性のあるオープンソースまたは商用のライブラリはありますか?
- ビデオのユーザー レコードとアップロードを使用して Web カメラを調整することを目的とする場合、[fx==fy または歪みパラメーターなし] などのパラメーターのどのような仮定が理にかなっていて、合理的に聞こえるでしょうか?
- すべてのカメラの固有パラメータと歪みパラメータの合理的な近似は理にかなっていますか? 特定の固有パラメータと歪みパラメータが特定の Web カメラに対してどの程度優れているかを検証するための合理的なアプローチは何でしょうか?
- 他に考慮すべき問題はありますか?