問題タブ [computer-vision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
20356 参照

c++ - Webカメラのオートフォーカスをプログラムで無効にする方法は?

ウェブカメラを使用してコンピュータービジョンを実行しようとしています(モデルはHercules Dualpixです)。使用するのに理想的なカメラではないことは知っていますが、ここでは選択の余地がありません。

問題は、オートフォーカスによってカメラのキャリブレーションが困難/不可能になることです。オートフォーカス機能を無効にする方法は誰でも知っています。または、誰かがそれに対処し、オートフォーカスでカメラを調整するアイデアを持っている場合。

0 投票する
4 に答える
1129 参照

algorithm - 画像認識のためのリソース

画像処理アルゴリズム(顔や形の認識など)の紹介に関する推奨事項を探していますが、本、ホワイトペーパー、またはWebサイトのいずれかについて誰かが良い推奨事項を持っているかどうか疑問に思います。

私は画像認識についてほとんど知らないことから始めて、大学でいくつかの数学をしました(ずっと前に)。

ヘルプやポインタをいただければ幸いです。

0 投票する
3 に答える
3170 参照

machine-learning - 画像から主な/最も使用される色を抽出する

画像内で最もよく使用される色、または少なくとも主要な色調を抽出したいのですが、このタスクを開始する方法を教えてください。または同様のコードを教えてください。私はそれを探していましたが、成功しませんでした。

0 投票する
9 に答える
53031 参照

graphics - この画像の長方形を認識する方法は?

水平線と垂直線のある画像があります。実は、この画像はBBCのウェブサイトを横線と縦線に変換したもの。私の問題は、画像内のすべての長方形を見つけられるようにしたいということです。すべての長方形を見つけるコンピューター プログラムを書きたいと思います。誰かがこれを行う方法を知っているか、開始方法に関するアイデアを提案していますか? このタスクは、人間として視覚的な四角形を見つけるのは簡単ですが、プログラムとして説明する方法がわかりません。

画像はこちらの BBC ウェブサイトhttp://www.bbc.co.uk/


これを更新して、BBC Web サイトの画像を水平線と垂直線に変換するコードを書きました。問題は、これらの線が角で完全に交わらず、長方形を完全に形成しない場合があることです。ありがとう!

0 投票する
9 に答える
60929 参照

python - 画像比較アルゴリズム

私は画像を互いに比較して、それらが異なるかどうかを調べようとしています。最初に、RGB値のピアソン相関を作成しようとしました。これは、画像が少しずれていない限り、非常にうまく機能します。したがって、100%同一の画像があり、1つが少し移動している場合、相関値が正しくありません。

より良いアルゴリズムのための提案はありますか?

ところで、私は何千もの画像を比較することについて話している...

編集:これが私の写真の例です(顕微鏡):

im1:

ここに画像の説明を入力してください

im2:

ここに画像の説明を入力してください

im3:

ここに画像の説明を入力してください

im1とim2は同じですが、少しシフト/カットされているため、im3は完全に異なるものとして認識されます...

編集: 問題はピーターハンセンの提案で解決されます!非常にうまく機能します!すべての回答に感謝します!いくつかの結果はここで見つけることができます http://labtools.ipk-gatersleben.de/image%20comparison/image%20comparision.pdf

0 投票する
1 に答える
966 参照

computer-vision - Emgu CV SURFFeature エラー

Emgu CV (Computer Vision) ライブラリをダウンロードし、SURFFeature の例を見てみました。

与えられた例の代わりに、比較するために2つの新しい画像を入れようとしていますが、この行で新しい画像でエラーが発生します:

私はこの例外を受け取ります:

OpenCV: 配列は CvMat または IplImage である必要があります

なぜそれが私のイメージを受け入れないのか理解できません。誰かアイデアはありますか?

トニー

0 投票する
1 に答える
829 参照

matlab - 対応するピクセルの計算

2台のカメラでコンピュータービジョンを設定しています。このカメラの1つは、飛行時間型カメラです。それは私にすべてのピクセルでシーンの深さを与えます。もう1台のカメラは、シーンのカラー画像を提供する標準カメラです。

深度情報を使用して、カラー画像から一部の領域を削除したいと思います。カラー画像での物体、人物、手の追跡を計画しており、飛行時間型カメラを使用して遠くの背景ピクセルを削除したいと考えています。カメラを並列セットアップで位置合わせできるかどうかはまだわかりません。

計算にはOpenCvまたはMatlabを使用できます。

整流、エピポーラ幾何学などについてたくさん読みましたが、すべてのピクセルの対応を計算するために必要な手順を確認するのにまだ問題があります。

どのアプローチを使用し、どの機能を使用できるか。問題をどのステップで分割しますか?どこかにチュートリアルやサンプルコードがありますか?

更新シーンに配置された既知のマーカーを使用して自動キャリブレーションを実行する予定です

0 投票する
3 に答える
930 参照

testing - コンピュータビジョンアルゴリズムの評価のためのシミュレーションと合成ビデオ生成

コンピュータービジョンソフトウェアをテストするための合成ビデオを生成する簡単な方法を探しています。

現在、私はこのニーズを対象とする1つのツール、 ObjectVideo Virtual Video(OVVV)のみを認識しています。これは、仮想世界でカメラをシミュレートできるHalfLife2modです。

しかし、私はもっとオープンで(オープンソースのように)そして多分ポータブルなソリューションを探しています。1つの方法は、必要な機能を1ダースのオープンソース3Dエンジンの1つに実装することです。ただし、OVVVのようなものをすでに実装しているライブラリまたはツールを誰かが知っていれば素晴らしいと思います。

また、すぐに使用できる解決策がない場合:どのように問題に取り組みますか?

PS:ここで私が尋ねる理由は、この問題に費やす努力を最小限に抑えたいからです。どうしたらいいかわからなかったわけではありません。しかし、私のソリューションでは、これに多くの時間を投資する必要があります。だから私はここで具体的なヒントを探しています...:-)

0 投票する
1 に答える
130 参照

image-processing - -dynamic-ビデオストリームを処理し、そのビデオストリーム内の「一致」の(相対的な)場所を見つけるにはどうすればよいですか?

質問が述べているように、動的なビデオストリームを処理するにはどうすればよいですか?ダイナミックとは、実際には画面上のものだけを処理したいという意味です。したがって、imagearrayはある種の「連続スクリーンショット」である必要があります。

特定のパターンに基づいてビデオ/画像を処理したいのですが。どうすればいいですか?

既存のコンポーネントがすでに存在する(そしておそらく存在する)場合は完璧です。一致(または部分一致)の場所を使用できるようにする必要があります。さまざまな要件に対応する.NETコンポーネントも役立つと思います...

0 投票する
3 に答える
4368 参照

image-processing - Photosynth のようなシーンの再構築

MS Photosynthに似たオープン ソース コードはありますか?

Photosynth は、2 つの独立したブレークスルーを強力に組み合わせたものです。1 つは、大量の平面写真からシーンまたはオブジェクトを再構築する機能であり、もう 1 つはインターネットを介して事実上すべての人にその体験を提供する技術です。

コンピューター ビジョンの分野の技術を使用して、Photosynth は画像の類似性を調べ、その情報を使用して被写体の形状と写真が撮影された視点を推定します。この情報を使用してスペースを再作成し、それをキャンバスとして使用して写真を表示およびナビゲートします。

ただし、その体験を提供するには、大量のデータを表示する必要があります。これは、Web 上で誰かのフォト アルバムを閲覧することで通常一度に取得できるデータよりもはるかに多くなります。そこで、必要なときに必要なピクセルだけを提供する Seadragon™ テクノロジーの出番です。たくさんのサムネイルをいじったり、すべてが読み込まれるのを待つことなく、5、10、または 100 (!) メガピクセルの写真を何十枚も簡単に閲覧できます。このリリースについて

Photosynth は、Microsoft Live Labs の 20 人の従業員からなる情熱的な小さなスタートアップから生まれました。私たちは科学者、エンジニア、デザイナーであり、Photosynth の約束を果たすために狂ったように働いています。