問題タブ [object-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
histogram - 大規模なデータセットのバッグオブワードオブジェクト認識
単語ヒストグラムのバッグを使用してオブジェクト認識を実装しています。ヒストグラムは、画像ごとに 200 個の「単語」で構成され、記述子からの kmeans です。問題は、大規模なデータセット (たとえば 5000 枚の画像) の場合、ヒストグラムに突然 200x5000=1,000,000 語が含まれることです。これは、すべてのオブジェクトが 1,000,000 の長さのヒストグラムで表されることを意味します。
これは、ある時点を過ぎると大きすぎて扱いにくくなります。この辺になんかあるの?
c++ - 目の検出と例外処理
これは、目を検出して座標を送信するために使用した関数です。
x1、x2、y2、y3 はグローバル変数で、TCP/IP ソケット プログラムを使用してデータを他のプログラムに送信しています。問題は、目を一度識別した後、焦点が合っていない場合、プログラムが動作を停止し、for ループで処理されない例外があることを示すエラー メッセージが表示されることです。for ループを try-catch ブロックで囲むと、エラーが持続します。実行時例外である可能性があります。それを取り除くために何をすべきですか?
opencv - OpenCV: 街の広場で人を検出する
このように、街の広場にいるすべての人またはグループを見つける必要があります。関数を使って(明るさとコントラストを補正する)CascadeClassifier.detectMultiScale
画像を用意するequalizeHist
ご覧のとおり、すべての人が見つかったわけではありません。
の説明でhaarcascade_fullbody.xml
は、検出器は正面図と背面図のみをサポートしていることを読みました。
この問題の haarcascades コレクションをいくつか知っていますか、それともコードを修正してこのカスケードを残す必要があるのでしょうか?
opencv - エッジ (またはコーナー) マッチングによるオブジェクト認識?
学術的な目的で、(とりわけ)エッジまたはコーナーマッチングを使用するオブジェクト認識システムを開発したいと考えています。
基本的に、モデル画像のコーナー情報を抽出し、コーナー情報を使用してクエリ画像内でこのオブジェクトを見つけようとします。
OpenCV内に何かヒントはありますか?
Ps。SIFT/SURF/ORB を使用できることはわかっていますが、この場合はコーナーまたはエッジを一致させる必要があります
pattern-matching - いくつかのクエリでビデオをスコアリングするためのビデオからのキー フレームの抽出
私は、クエリで定義されたオブジェクト、動物などの包含に応じてビデオをスコアリングする必要があるコンピューター ビジョン プロジェクトに取り組んでいます。しかし、このミッションでは、まずビデオからいくつかのキー フレームを取得して処理することを目指します。その抽出を行う方法を知っていますか?私はこのテーマについて非常に初心者です。
python - オブジェクト識別のための点の分布の分類
分類しなければならない点がいくつかあります。これらのポイントのコレクションを考えると、それらが最もよく一致する他の (既知の) 分布を言う必要があります。たとえば、左上の分布のポイントが与えられた場合、私のアルゴリズムは、それらが 2 番目、3 番目、または 4 番目の分布のどれと一致するかを判断する必要があります。(ここでは、向きが似ているため、左下が正しいでしょう)
私は機械学習のバックグラウンドを持っていますが、専門家ではありません。私はガウス混合モデル、またはおそらく隠れマルコフモデルを使用することを考えていました(以前にこれらの同様の問題で署名を分類したため)。
この問題にどのアプローチを使用するかについての助けをいただければ幸いです。背景情報として、私は OpenCV と Python を使用しているため、選択したアルゴリズムを最初から実装する必要はほとんどないでしょう。この問題に適用できるアルゴリズムを知るためのポインタが必要です。
免責事項: 私はもともとこれを StackExchange の数学セクションに投稿したかったのですが、画像を投稿するのに必要な評判がありませんでした。いくつかの画像を見せないと私の主張がはっきりしないと感じたので、代わりにここに投稿しました。最終的にはオブジェクトの識別に使用されるため、コンピューター ビジョンと機械学習にまだ関連していると思います。
編集:
以下に示す回答のいくつかを読んで検討しましたが、新しい情報を追加したいと思います。これらの分布を単一のガウスとしてモデル化したくない主な理由は、最終的には分布を区別できるようにする必要があるためです。つまり、2 つの異なるオブジェクトを表す 2 つの異なる別々の分布が存在する可能性があり、アルゴリズムは、2 つの分布のうちの 1 つだけが関心のあるオブジェクトを表すことを認識する必要があります。
image-processing - OpenCV Haar カスケード分類器を使用した形状の検索
いくつかのレーダー データで放物線を探しています。OpenCV Haar カスケード分類子を使用しています。私のポジ画像は 20x20 の PNG で、すべてのピクセルが黒ですが、放物線の形状 (ポジ画像ごとに 1 つの放物線) をトレースするものは除きます。
私の質問は次のとおりです。これらのポジティブは、放物線を含むブラック ボックスを探すように分類器をトレーニングしますか、それとも放物線形状を探すように分類器をトレーニングしますか?
ポジ画像に中程度の値のノイズのレイヤーを追加する必要がありますか?それとも、非現実的なほど鮮明で高コントラストにする必要がありますか?
元データの一例です。
これは、GIMP を使用して単純なエッジ検出を実行した後のデータの例です。放物線形状は白いボックスで強調表示されます
これが私のポジティブなイメージの1つです。
c++ - コントラストの低い背景からオブジェクトを抽出する
背景がほぼ平らな画像からオブジェクトを抽出する必要があります...
たとえば、大きな白いデスクトップ上の本を考えてみましょう。ROI を抽出するには、本の 4 つの角の座標を取得する必要があります。
OpenCVを使用したどのテクニックを提案しますか? k Means を使用することを考えていましたが、アプリオリに背景の色を知ることができません (オブジェクト内の色も異なる可能性があります)。
pattern-matching - オブジェクト パターンのトレーニングと認識 (画像ベース)
オブジェクト パターンのトレーニングと認識のための c/c++ ライブラリはありますか? Google ゴーグル (http://www.google.com/mobile/goggles/#text) と同様の機能を実装する必要があります。