問題タブ [vision]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
math - VBScript を使用して、既知のサイズのオブジェクトとカメラの間の距離を計算するにはどうすればよいですか?
オブジェクトの寸法とカメラに関するすべてを知っています。距離の結果は、少なくとも 1 秒あたり 4 回更新する必要があります。
カメラ フィードは、ラップトップに wLAN 接続されたロボットから送信されます。ラップトップは、ロボット オペレーター用に一種のダッシュボードを表示するアプリケーションを実行します。この特定のアプリを使用する必要があり、カスタム ダッシュボード ゲージ用の VBScript のみをサポートしています。
カメラ フィードから画像データを取得し、距離を計算するにはどうすればよいですか? VBScript についてはよくわかりません。
python - Python を使用した産業用ビジョン カメラ
Python インターフェイスを備えた産業用コンピューター ビジョン カメラ、または十分に開発されたサードパーティ ソリューションを備えた産業用コンピューター ビジョン カメラはありますか?
OpenCVなどから簡単にアクセスできるWebカメラを使用して、いくつかの作業を行っています。しかし、今はより堅牢で柔軟なカメラが必要です。露出やゲインなどの特定のパラメータを設定できる必要があります。Python は私が最もよく知っている言語なので、可能な限り Python 以外の言語での開発は避けたいと考えています。
uEye カメラ用の pyueye などのプラグインを見たことがありますが、これは Windows ではうまく機能しないことを除けば問題ないようです。
c - 非標準ライブラリを使用しない組み込みシステムでのオブジェクト検出に関するアドバイス
画像内の正方形または円形のオブジェクトを検出するための良い方法について、アドバイスを探しています。現在、元のグレースケールでキャニー エッジ アルゴリズムを実行しており、次の出力を生成できます。
この画像にキューブサットがあることがわかりましたが、プログラムがそれを確認できる計算効率の良い方法は何ですか? ハフ変換を見てきましたが、それは非常に計算量が多いようです。私はハリスのコーナー検出も調べましたが、基本的には、前述の立方体衛星を含む写真を分離しようとしているため、多くの誤検知が発生すると思います。
追求すべき優れたアルゴリズムについて考えている人はいますか? スペースが非常に限られているため、opencv などの大規模な外部ライブラリは使用できません。(これはすべて C で書かれています)
どうもありがとう!
labview - LabVIEW2011にsubviがありません
.viを読み込もうとしています。ロード中、LabVIEWはでviを探しています..\National Instruments\Labview 2011\examples\Vision Acquisition\NI-IMAQdx\High Level\SubVIs\
ただし、「examples」に「VisionAcquisition」フォルダがありません。私は何が欠けていますか?
opencv - computervision: ヌード検出ソリューションの比較 (opencv ベースまたはカスタム コード) & ハッシュ リスト & クライアント サイド
サーバ側:
- リスト項目:
- ...: x% の一致が見つかり、y% の誤検知 (opencv +10 行のコード)
- ...: x% の一致が見つかり、y% の誤検知(1995 年以降の大規模なカスタム コード)
- 別:
最小限の OpenCV C++ コード:
/li>
ハッシュ リスト:
- ..: (公費で賄われており、現在はアクセスが制限されています...)
- ...: (オープンアクセス)
- ...: , y 百万件のエントリ, y % 昨年の新規(コマーシャル $y / 月)
- ...: , x 百万エントリ, x % 過去数年間の新規(コマーシャル $x / 月)
(サーバーサイド &) クラウドソーシング / クラウド検証済み:
- Google 画像のフィルター: ... (アクセスは制限されていますが、所有している Web サイトの webmastertools でもありません)
クライアント側:
- 別: ... (i5 2540 モバイルでは 50 ミリ秒あたり x メガピクセルをスキャンします)
- Nude.js (パトリック・ウィード): ...
私はこの質問を完全に書き直しました。これは常に閉じられており、具体的ではなく広範であり、代替手段ではなく「リンクを促進する」ように見えましたか?
ここでのタスクは次のとおりです。
「この開発固有の、しかし広く知られていないタスクに対するすべての世界の既存のアプローチの目録を作成する」。(= 上記の表のギャップを埋めるため、およびおそらくサンプル コード/実装)
一部の Windows ソフトウェアは、子供がネットサーフィンをしている親向けに販売されていますが、この想定は、開発の観点から、ウィキペディアの記事 「ヌード検出ソフトウェアの比較」にすぐには表示されません。(alternative.to/... にもありません)
また、これは具体的ですが、広く十分に活用されておらず、実践されていません。したがって、単一の回答/リンクが自己宣伝/スパムのようなものになることはありません。逆に、この質問は平均的な質問よりも少ない傾向があります. それでも、リンクはまったく必要ありません。また、個人的な意見を含む回答はありません。もしあれば、それは何の役にも立ちません.
c++ - C++ マルチスレッド データ管理
私のコンピュータービジョンプロジェクトで大量のデータを管理することに関する概念的なアドバイスを探しています。カメラからプログラムへの入力として、またコードによって生成されたこの大量のデータ ストリームを調整するという概念を、a) 概念化および b) 実装するのに問題があります。
したがって、処理する必要があるデータは、次のように 5 つの個別の「ストリーム」に分割できます。
生フレーム (カメラからの直接入力) ターゲット画像 (前の画像ストリームから取得したサブフレーム) タイムスタンプ (生フレーム用) 車両姿勢データ (車両へのワイヤレス シリアル ポート接続からの GPS、車体角度など)態度データのタイムスタンプ
これを完全に順番に行う場合、一般的な流れは次のようになります。
アルゴリズムは非常にプロセッサを集中的に使用し、連続的に関連付けられていないため、スレッドを使用してこれを実行しようとしています (ターゲットの GPS 座標を取得するために色データは必要ないということです)。ただし、画像をターゲットに、タイムスタンプをそれらの画像に合わせて調整する必要があるため、適切な画像に適切な車両データを使用できます。
私の友人はリレーショナル DB アプローチを提案しましたが、私は C++ を使用しています。私が疑問に思っているのは、C++ でリレーショナル DB を模倣する方法 (データまたはターゲット イメージに関連付けられたタイムスタンプまたはターゲット ID のように、キーをデータに関連付ける方法) があるかどうかです。SQL DB に接続すると、これを管理しやすくなりますか? そうすることに関連して、重大なパフォーマンスの低下はありますか? ここで最も重要な点は、何をするにしても、安全にマルチスレッド化できるように共有データをロックできなければならないということです。
このような階層データ構造の経験がある人が私の状況に光を当ててくれることを願っています。あなたのアイデアと批判を前もって感謝します。
artificial-intelligence - AND/OR グラフのチュートリアル
AND/OR グラフを使用して、コンピューター ビジョン研究の問題の 1 つをモデル化する必要があります。しかし、何時間も検索した後、ウィキの資料がほとんどないことを除いて、AND/OR グラフの基本に関する適切なチュートリアルを見つけることができませんでした。AND/OR グラフに関するチュートリアルを紹介してもらえますか?
ありがとうハサン
image - 類似画像の識別における Phash と SIFT
まず、SIFT を使用してリアルタイム サービスで類似画像を識別しています。携帯電話のカメラで撮影した写真のように、わずかな回転とぼやけ効果が発生する可能性があります。
そして、Phashを見つけました。それで、デモページでphashをテストします。しかし、結果は私にため息をつきました。
これは上記のテストの結果です:
このテストでは、2 つの画像が x 軸に固定されています。したがって、回転はありません。ただし、右の画像のロゴは削除され、人物は左側に移動されました。私の目には、これは「非常に似ている」です。さらに、SIFTはこれを完全にキャッチします。
では、質問です。
- pHash は SIFT よりも高速ですか?
- pHash の精度は信頼できますか?
- SIFT の出力は、リアルタイム サービスで使用するには大きすぎました。したがって、ハッシュを使用して、 LSH(Locality-sensitive hashing) のように出力を小さくする必要があります。私が試す他の方法はありますか?