私はプロジェクトに取り組んでおり、その一部はカメラに記録されたオブジェクトを認識することです。より具体的には:
私はOpenCVを使用しています
カメラを正しくセットアップし、そこから写真を取得できます
私は OpenCV からの多数のデモをコンパイルして実験しました
検出には、スケールと回転に不変のアルゴリズムが必要です
元のオブジェクトの写真は、エッジ画像としてのみ利用可能です
これまでに見たすべての特徴検出/抽出/マッチングアルゴリズムは、グレースケール画像 (写真など) でかなりうまく機能しますが、プロジェクトの仕様により、エッジ画像 (キャニーエッジ検出器の出力のようなもの) を処理する必要があります。通常、BW であり、画像内で見つかったエッジのみが含まれます。この場合、使用しようとしていたアルゴリズム (SURF、SIFT、MSER など) のパフォーマンスが劇的に低下します。
したがって、実際の質問は次のとおりです。エッジ画像のマッチングに固有のアルゴリズムに出くわした人はいますか、それとも SIFR/SURF/ のパフォーマンスを改善できる特定のセットアップはありますか? そのような入力でうまく機能するために。
関連するリソースへのアドバイスやリンクをいただければ幸いです
PS: これは、stackoverflow に関する私の最初の質問です。