0

ウェブカメラを使用して、私が持っているデータベースから画像を見つけたいと思います。

具体的には、人々がアイテムを持って歩き、カメラの前に置き、データベースで価格を検索できる「価格キオスク」をセットアップしたいと考えています。いくつかの理由から (使いやすさが最も重要です)、製品にバーコードを使用したくありません。

これらのアイテムは比較的簡単にスキャンできます (実際には 2D です: コミックです)。すべての表紙をスキャン済みです。だから私が望むのは、ウェブカメラから画像を取得し、それを検索のソースとして使用する方法です。もちろん、画像は歪みます (角度、焦点、解像度、照明、回転など)。これは、Google ゴーグル (実際には Google 画像) の問題ではありません。コミックの表紙をさまざまな条件でスキャンしたところ、それらを見つけることができるからです。

今、私はいくつかの研究を行ってきました。私は OpenCV でかなり素晴らしいことを成し遂げたように思えます。これは、実装するのがそれほど難しいことではないと思います。特に、私のデータセットは Google のデータセットよりもはるかに小さい (約 2000 種類の製品) ことを考慮してください。

具体的に何を探していますか?オブジェクトの検出、認識、機能...? 私は混乱していて、どこから始めればよいかさえわかりません。

4

1 に答える 1

0

SIFT を読む: (スケール不変特徴変換)

于 2013-03-26T21:50:56.140 に答える