問題タブ [vision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
164 参照

product - ソフトウェア開発は、ソフトウェアの設計と使いやすさから分離する必要がありますか?

これまでの営業職は「コードを書く」ことがほとんどでしたが、そもそも開発の道に進みたいと思ったのは、ソフトウェアのユーザビリティとデザインの側面が好きだったからです。

今では、私の仕事のほとんどすべてが「物事をつなぐ」ことに費やされているので、少しがっかりしています。それは想像を絶する最もありふれた仕事のように思えますし、それができると人々が考えるプログラマーが一部の業界で見下されがちであることは驚くことではありません。

私の質問に行きましょう - クリエイティブなコントロールが必要な開発者向けの仕事はありますか? ただのコード モンキーではなく、美しい製品を構築し、コードだけでなく、製品の設計とビジョン全体に深く関与したいと考えている開発者向けですか?

0 投票する
5 に答える
846 参照

requirements - ビジネス要件によるビジョンの定義

いくつかのビジネスのために[一般的に]ビジョンを書く方法は?テンプレートはありますか?例はありますか?オンラインチケットサービスに関するビジネス。

0 投票する
2 に答える
2250 参照

vision - ステレオ ビジョンを使用して室内環境を正確に 3D 再構成する方法は?

openCV で cvStereoFindCorrespondenceGC() を使用して、有名なつかばの画像から視差マップを生成しました。しかし、3D 機能が不足していることに気付きました (たとえば、ランプはわずかに湾曲しているのではなく、平らです)。この問題にアプローチするには?現在のアルゴリズムに欠けていたものは何ですか?

0 投票する
2 に答える
2657 参照

c++ - OpenCV1.1K-高次元空間でのクラスタリングを意味します

機能システム画像認識システムのバッグを書こうとしています。アルゴリズムの1つのステップは、多数の小さな画像パッチ(たとえば、7x7または11x11ピクセル)を取得し、それらを類似したグループにクラスター化することです。画像からパッチを取得し、それらをグレースケール浮動小数点画像パッチに変換してから、cvKMeans2を取得してそれらをクラスター化しようとします。KMeans2が一貫した結果を返すように入力データをフォーマットするのに問題があると思います。私は以前に2Dおよび3DクラスタリングにKMeansを使用しましたが、49Dクラスタリングは別の獣のようです。

返されたクラスターベクトルのガベージ値を取得し続けるので、明らかにこれはガベージイン/ガベージアウトタイプの問題です。さらに、アルゴリズムは、このような巨大なデータセットの場合よりもはるかに高速に実行されます。

以下のコードでは、ストレートmemcpyは、入力データを正しい形式で取得するための最新の試みにすぎません。組み込みのOpenCV関数を使用してしばらく過ごしましたが、基本タイプがCV_32FC(49)の場合は困難です。

OpenCV 1.1のKMeansアルゴリズムは、この種の高次元分析をサポートできますか?

画像からK-Means入力行列にコピーする正しい方法を誰かが知っていますか?

代わりに使用できる無料の非GPLKMeansアルゴリズムを誰かに教えてもらえますか?

私は今、物事を機能させようとしているだけなので、これは最良のコードではありません。

前もって感謝します!

0 投票する
3 に答える
2819 参照

image - OpenCV: 画像の描画

私はOpenCVライブラリを使用するプログラムに取り組んでいます(私はそれについてかなり初心者です)。私がしなければならないことの 1 つは、画像に描画することです。OpenCV の描画関数を調べたところ、それらはすべて非常に単純 (Circle、Line など) に見えますが、プログラムはコンパイルされません! 正確には、エラー C3861: '行': 識別子が見つかりません。インストールしていないものはありますか?http://opencv.willowgarage.com/wiki/VisualC%2B%2B_VS2008のチュートリアルを使用してOpenCV を Visual Studio 2008 にインストールしましたが、これが唯一の本当の問題です。私を助けてください!このプログラムをできるだけ早く機能させる必要があります。

0 投票する
2 に答える
1922 参照

opencv - OpenCVを使用してリアルタイム分析のために表示出力をキャプチャしようとしています。入力のためにOSとのインターフェースについてサポートが必要です

OpenCVコンピュータービジョンライブラリの操作を、コンピューターのディスプレイからキャプチャしたビデオにリアルタイムで適用したいと思います。この特定のケースのアイデアは、人気のあるゲームのゲームプレイ中に興味深い機能を検出し、ユーザーに強化されたエクスペリエンスを提供することです。しかし、このデータへのライブアクセスも必要になる他のいくつかのシナリオを考えることができます。いずれにせよ、開発フェーズでは、缶詰のビデオを使用しても問題ないかもしれませんが、最終的なアプリケーションのパフォーマンスと応答性は明らかに重要です。

私は今のところUbuntu10.10でこれを行おうとしており、UNIXライクなシステムを使用したいと思っていますが、任意のオプションに関心があります。私のCスキルは非常に限られているので、Pythonを介してOpenCVと通信できる場合は常に、代わりにそれを使用するようにしています。カメラデバイスからではなく、ディスプレイ出力のライブストリームからキャプチャしようとしていることに注意してください。そして、私はどのように入力を受け取るかについて途方に暮れています。私の知る限り、CaptureFromCAMはカメラデバイスでのみ機能します。最終的にはリアルタイムのパフォーマンスが必要なため、ファイルに保存してCaptureFromFileを読み戻すのは悪いオプションのようです。

私がこれまでに見つけた最も有望なルートは、x11ディスプレイからキャプチャするためにx11grabオプションでffmpegを使用しているようです。(たとえば、コマンドffmpeg -f x11grab -sameq -r 25 -s wxga -i:0.0 out.mpgは、ディスプレイ0の1366x768を'out.mpg'にキャプチャします)。おそらくパイプを使用することで、ffmpegからの出力ストリームをOpenCVによって読み取られるファイルとして(おそらくCaptureFromFile関数を使用して)処理できるはずだと思います。しかし、これはすべて私がこれまでに扱ったよりもはるかに高いレベルであり、私は実際にいくつかの方向性を使用することができました。このアプローチは実行可能だと思いますか?そしてもっと重要なことに、あなたはより良いものを考えることができますか?どうしますか?

0 投票する
2 に答える
259 参照

language-agnostic - 3Dビューの左右の画像が反転するとどうなりますか?

些細な投稿で申し訳ありませんが、私は本当にそれを理解することはできません...

3Dメガネなど、3Dステレオビジョンを可能にするものがあるとします。

左右の画像を反転するとどうなりますか?それを考えると、私はそれを本当に理解することはできません。画像の裏側を見る必要がありますか?それとも軸シフトだけですか?

残念ながら試してみることができませんが、できれば試してみる前に心の中で理解していきたいと思います。

ですから、私が理解したり、深く議論したりするのに役立つ助け、アイデア、ヒットを歓迎します。

0 投票する
2 に答える
418 参照

image - 画像からポイントを取得

与えられた画像からポイントを抽出したい。画像を以下に示します。 ここに画像の説明を入力してください

私が欲しいポイントは、緑の上のポイントと赤いポイントです。ピクセルごとの比較を試しましたが、遅すぎます。より良いアルゴリズムが必要です。あなたの提案は何ですか?

0 投票する
1 に答える
318 参照

php - 有機的な形状の検出と測定 (PHP、JS ... またはその他)

絵:

http://img511.imageshack.us/i/measuring1and2space.gif/

.gif 画像があります。大きな白い「海」(1) に対する 3 つの黒い島 (2) のサイズを測定します。(3) は背景です。(1) の境界と見なす必要がありますが、測定したくありません。(0) は選択されたメイン エリア (この場合は (1)) であり、測定の参照エリアとして使用する必要があります。したがって、この場合 (0) は (1) に含まれるため、それ自体が 100% (参照) になります。したがって、3 つの島は (0) のサイズの約 xx% です。(0) が (2) にある場合、(1) は島の Xxx% です。

わかりました...言ってみましょう:

1) ユーザーは(1)で(0)を取る。彼が JS を使用していて、赤い点を白い領域にドラッグ アンド ドロップしたとします。赤い点は、その下の領域の色を検出します。

2) ここで、システムは白い領域全体を検出し、それを (0) に設定して 100% にする必要があります。システムは (2) と (3) を区別する必要があります。したがって、(2) と (1) のサイズの関係を測定することができます。


そのようなアルゴリズムが PHP でどのように可能になるか想像できません。それは素晴らしいことですが、可能であれば... OpenCVのようなものがより良い解決策だと思います。残念ながら、私はそれを経験したことがありません。PHP でいくつかの CV をコーディングしようとしましたが、幾何学的な形状があれば実行可能ですが、これらは有機的です。

方向性を教えてください。どこに行けばいいのかわからない。:(

前もって感謝します。:)

0 投票する
5 に答える
12629 参照

iphone - iPhoneの番号認識はリアルタイムで可能ですか?

iPhoneのカメラ画像からリアルタイムで数字を認識する必要があります。画像に5桁以下しかないことはわかっています。

iPhone の計算仕様を考えると、この問題を解決するのは現実的ですか? Tesseract OCR ライブラリを使用した経験のある人はいますか?それを使用することで解決できると思いますか?