問題タブ [computer-vision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
6 に答える
1915 参照

c# - 車両システム用のプログラマブル カメラ C#

私は最近、車両ベースのコンピューター ビジョン システムを取得する必要があるプロジェクトに参加しました。では、さまざまな速度で移動しながら画像をキャプチャできるようにするために、カメラにはどのような特別な機能が必要なのでしょうか? たとえば、必要なフレーム レート、露光時間、シャッター スピードなど。ウェブカメラ(ハイエンドであっても)でそれを達成できると思いますか?このプロジェクトでは、カメラを C# でプログラムできる必要があります。よろしくお願いします。

0 投票する
4 に答える
41161 参照

machine-learning - 画像のロゴ認識

画像のロゴ認識に関して行われた最近の学術研究を知っている人はいますか?この特定の主題に精通している場合にのみ回答してください(Googleで「ロゴ認識」を自分で検索できます。ありがとうございます)。コンピュータビジョンに精通していて、オブジェクト認識の仕事をしたことがある人なら誰でもコメントを歓迎します。

更新:技術的な側面(使用されているプログラミング言語またはOpenCVを使用したかどうか...)画像のインデックス作成とコンテンツベースの画像検索の作業も役立ちます。

0 投票する
2 に答える
8054 参照

image-processing - デーバナーガリー語のOCR(ヒンディー語/マラーティー語/サンスクリット語)

現代の機械学習技術を使用したインドのスクリプトの光学式文字認識で行われている最近の作業について誰かが知っていますか?ISI、カルカッタで行われているいくつかの研究を知っていますが、私の知る限り、過去3〜4年間で新しいものは何も出てきておらず、デーバナーガリーのOCRは悲しいことに欠けています!

0 投票する
2 に答える
990 参照

math - 3D 空間で任意に変換された正三角形の法線

出発点を見つけることができないように見える問題があります。答えを得るのに十分なほどうまく説明できるかどうかさえわかりません。

三角形の点を事前に知らなくても、3D 空間で正三角形の法線を見つける必要があります。三角形の「譲歩」道路標識の写真を任意の角度から撮影し、その写真から標識の外向きの法線を決定することを考えてみてください。(正確にはそうしていませんが、似ています。したがって、ここからは記号/写真の比喩を使用します)。

** 更新 **: この同じ質問が、私のバージョンを尋ねる前日に出てきました。ここで見ることができます。私を指摘してくれたBlueRajaに感謝します。そこでの議論が答えになると思います。ただし、以下に示す計算アプローチも非常に興味深いものです。

コードで三角形を作成するときに三角形の法線を見つける方法は知っていますが、3D で写真の三角形にポイントをマッピングする方法がわかりません。各辺の長さを知っているので、どの方向でもポイントをどれだけ離す必要があるかがわかります。三角形をオーバーレイして位置に合わせて回転させ、そこからポイントを取得できる対話型ツールを構築できますが、対話なしでこれを行う必要があります。それをしても、関連する数学を理解するのに役立ちません。

正しい回転行列を見つけるだけでなく、ポイントを決定する必要があるかどうかさえわかりません。

どこから始めればよいのかわかりません... コンセプトの検索結果が空になるか、目的の検索結果が得られない (例: それらは 3D ではなく 2D 変換です)

また、私が物事を過度に複雑にしている可能性もあり、スリープ状態でこれを行う単純な変換方程式があります。

考え?前もって感謝します!

0 投票する
5 に答える
31490 参照

image-processing - ニューラルネットワークに画像を入力する方法は?

ニューラル ネットワークの仕組みは理解できましたが、実際の文字認識などの画像処理に使用したい場合、画像データをニューラル ネットワークに入力する方法がわかりません。

A私は手紙の非常に大きなイメージを持っています。たぶん、画像から情報/仕様を取得して、その仕様の値のベクトルを使用する必要がありますか? そしてそれらはニューラルネットの入力になりますか?

誰がすでにそのようなことをしたことがありますか?その方法を説明できますか?

0 投票する
3 に答える
5772 参照

iphone - カメラを介した形状認識のための iPhone ライブラリ

これが「プログラミングの質問」のカテゴリに収まることを願っています。私は、「コンピューター ビジョン」というテーマに関するグーグル検索 (および、このテーマに関するすべての投稿を読んでいる) に頭がおかしくなりましたが、理解するよりも混乱しています。

一枚の紙に印刷された 6 つの抽象的な形があり、iPhone のカメラでこれらの形を (さまざまな角度、稲妻などから) 識別できるようにしたいと考えています。

私はしばらく前にOpenCV(Java)を使用しており、他のライブラリを調べました。警告は、彼らが刑務所で壊れたiPhoneに依存しているように見えるか、またはそれらが非常に実験的で使いにくいため、ライブラリを学習して機能しないことを理解するためだけに何日も費やすことになるだろうということです.

+1000 枚以上の図形の画像を取得し、Haar フィルターをトレーニングすることを考えました。しかし、もう少し簡単に作業できるものがあれば、少し経験のある人のアドバイスや提案をいただければ幸いです。

提案やアドバイスをありがとうございます:)

0 投票する
2 に答える
3370 参照

image-processing - ビデオフレームで検出したオブジェクトを認識する方法は、人または車です

画像またはビデオフレーム内のオブジェクトを検出するのに問題があります。

Webカメラの視界に入った人や何かを検出するタスクがあり、システムがアラームを発します。

次のステップは、オブジェクトがどのようなものであるかを認識することです。このフェーズでは、ハフ変換を使用して線、円、さらには長方形を検出します。しかし、人々がカメラの視界に入ると、人々のプロファイルは線、円、長方形よりも複雑になります。オブジェクトが車ではなく人であることをどのように認識できますか。

それを知るために助けが必要です。前もって感謝します

0 投票する
6 に答える
23922 参照

image-processing - 背景画像を削除して前画像を取得する方法

2つの画像があります

代替テキスト http://bbs.shoucangshidai.com/attachments/month_1001/1001211535bd7a644e95187acd.jpg 代替テキスト http://bbs.shoucangshidai.com/attachments/month_1001/10012115357cfe13c148d3d8da.jpg 1 つは背景画像です。同じ背景、同じサイズ、私がやりたいことは、2 番目の画像の背景を削除し、人物のプロファイルのみを抽出することです。一般的な方法は、2 番目の画像から最初の画像を差し引くことですが、私の問題は、人物の着用の色が背景に似ている場合です。減算の結果はひどいです。全員のプロフィールを取得できません。背景を削除する良いアイデアがある人は、アドバイスをください。前もって感謝します。

0 投票する
2 に答える
601 参照

image-processing - 私たちが写真で意図しているオブジェクトの種類を認識する方法

これは犬の輪郭と馬の輪郭の 代替テキストの写真ですhttp://www.tlnews.cn/forum/attachments/month_0810/20081024_2f055de790b83aced18atjm8EVN4Gyay.jpg

それが馬か犬か人かをコンピュータに知らせる方法。 代替テキストhttp://www.pocketgo.com.cn/upload/2008-10/122465306490637600.jpg

0 投票する
2 に答える
153 参照

image-processing - プロのコンピューター ビジョンの Web サイトを勧めてくれたので、そのサイトで質問できます

プロのコンピューター ビジョンの Web サイトを勧めてくれたので、そのサイトで質問できます。どうもありがとう