問題タブ [computer-vision]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
image-processing - Computer vision application for automotive telematics application
What sort of application can be considered to be the really business winner for automotive telematics applications related to image processing/computer vision ? here are the criteria : 1. Innovative 2. Social 3. Fun.
matlab - MATLABで移動した変位の計算
2つ以上の画像を比較して、ポイントがx方向とy方向にどれだけシフトしたかを計算する必要があります。これをMATLABで行うにはどうすればよいですか?
matlab - MATLAB のハウライン
Hough linesを使用して画像内の線を検出した後、それを使用して参照画像の線の角度 (回転) の変化を計算するにはどうすればよいですか?
image-processing - OpenCVを使用して画像内の長方形の位置を見つける
OpenCV を使用して、iPhone ゲームBlockedのスクリーンショットを「解析」しようとしています。スクリーンショットは次のように切り取られます。
今のところ、各長方形を構成する 4 つの点のそれぞれの座標を見つけようとしているだけだと思います。OpenCV に付属のサンプル ファイル squares.c を見ましたが、この画像でそのアルゴリズムを実行すると、72 個の四角形が表示されます。長方形。これにアプローチするより良い方法は何ですか? Google で調べてみましたが、すべての検索結果について、関連する有用な情報はほとんどありません。
c# - 車両システム用のプログラマブル カメラ C#
私は最近、車両ベースのコンピューター ビジョン システムを取得する必要があるプロジェクトに参加しました。では、さまざまな速度で移動しながら画像をキャプチャできるようにするために、カメラにはどのような特別な機能が必要なのでしょうか? たとえば、必要なフレーム レート、露光時間、シャッター スピードなど。ウェブカメラ(ハイエンドであっても)でそれを達成できると思いますか?このプロジェクトでは、カメラを C# でプログラムできる必要があります。よろしくお願いします。
machine-learning - 画像のロゴ認識
画像のロゴ認識に関して行われた最近の学術研究を知っている人はいますか?この特定の主題に精通している場合にのみ回答してください(Googleで「ロゴ認識」を自分で検索できます。ありがとうございます)。コンピュータビジョンに精通していて、オブジェクト認識の仕事をしたことがある人なら誰でもコメントを歓迎します。
更新:技術的な側面(使用されているプログラミング言語またはOpenCVを使用したかどうか...)画像のインデックス作成とコンテンツベースの画像検索の作業も役立ちます。
image-processing - デーバナーガリー語のOCR(ヒンディー語/マラーティー語/サンスクリット語)
現代の機械学習技術を使用したインドのスクリプトの光学式文字認識で行われている最近の作業について誰かが知っていますか?ISI、カルカッタで行われているいくつかの研究を知っていますが、私の知る限り、過去3〜4年間で新しいものは何も出てきておらず、デーバナーガリーのOCRは悲しいことに欠けています!
math - 3D 空間で任意に変換された正三角形の法線
出発点を見つけることができないように見える問題があります。答えを得るのに十分なほどうまく説明できるかどうかさえわかりません。
三角形の点を事前に知らなくても、3D 空間で正三角形の法線を見つける必要があります。三角形の「譲歩」道路標識の写真を任意の角度から撮影し、その写真から標識の外向きの法線を決定することを考えてみてください。(正確にはそうしていませんが、似ています。したがって、ここからは記号/写真の比喩を使用します)。
** 更新 **: この同じ質問が、私のバージョンを尋ねる前日に出てきました。ここで見ることができます。私を指摘してくれたBlueRajaに感謝します。そこでの議論が答えになると思います。ただし、以下に示す計算アプローチも非常に興味深いものです。
コードで三角形を作成するときに三角形の法線を見つける方法は知っていますが、3D で写真の三角形にポイントをマッピングする方法がわかりません。各辺の長さを知っているので、どの方向でもポイントをどれだけ離す必要があるかがわかります。三角形をオーバーレイして位置に合わせて回転させ、そこからポイントを取得できる対話型ツールを構築できますが、対話なしでこれを行う必要があります。それをしても、関連する数学を理解するのに役立ちません。
正しい回転行列を見つけるだけでなく、ポイントを決定する必要があるかどうかさえわかりません。
どこから始めればよいのかわかりません... コンセプトの検索結果が空になるか、目的の検索結果が得られない (例: それらは 3D ではなく 2D 変換です)
また、私が物事を過度に複雑にしている可能性もあり、スリープ状態でこれを行う単純な変換方程式があります。
考え?前もって感謝します!
image-processing - ニューラルネットワークに画像を入力する方法は?
ニューラル ネットワークの仕組みは理解できましたが、実際の文字認識などの画像処理に使用したい場合、画像データをニューラル ネットワークに入力する方法がわかりません。
A
私は手紙の非常に大きなイメージを持っています。たぶん、画像から情報/仕様を取得して、その仕様の値のベクトルを使用する必要がありますか? そしてそれらはニューラルネットの入力になりますか?
誰がすでにそのようなことをしたことがありますか?その方法を説明できますか?
iphone - カメラを介した形状認識のための iPhone ライブラリ
これが「プログラミングの質問」のカテゴリに収まることを願っています。私は、「コンピューター ビジョン」というテーマに関するグーグル検索 (および、このテーマに関するすべての投稿を読んでいる) に頭がおかしくなりましたが、理解するよりも混乱しています。
一枚の紙に印刷された 6 つの抽象的な形があり、iPhone のカメラでこれらの形を (さまざまな角度、稲妻などから) 識別できるようにしたいと考えています。
私はしばらく前にOpenCV(Java)を使用しており、他のライブラリを調べました。警告は、彼らが刑務所で壊れたiPhoneに依存しているように見えるか、またはそれらが非常に実験的で使いにくいため、ライブラリを学習して機能しないことを理解するためだけに何日も費やすことになるだろうということです.
+1000 枚以上の図形の画像を取得し、Haar フィルターをトレーニングすることを考えました。しかし、もう少し簡単に作業できるものがあれば、少し経験のある人のアドバイスや提案をいただければ幸いです。
提案やアドバイスをありがとうございます:)