問題タブ [object-detection]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1676 参照

opencv - 64 x 128ピクセルより大きい画像の場合、HoGの画像をトレーニングするにはどうすればよいですか?

私は将来の変更のために独自のHoGを作成し、さまざまなアプローチを試しています。しかし、私はこの質問/問題に出くわしました。

INRIAからデータセットをダウンロードしましたが、320x240の画像があります。HoGのデフォルトのトレーニングウィンドウサイズは64x128ですが、これをどのように回避すればよいですか?

ポジティブ画像の場合、それらは約96 x 160ピクセルであり、私が行ったのは64 x 128にサイズ変更することです。しかし、より大きな画像の場合、サイズを変更するか、ピクセルごとに移動するスライディングウィンドウを使用するか、またはその大きな画像の64x128パッチの特徴を計算しますか?

0 投票する
1 に答える
2979 参照

image-processing - ビデオからのオブジェクトの分類 (人間、動物、その他 (車など) )

こんにちは、画像処理分野の初心者です。私のプロジェクトは、画像/ビデオ内のオブジェクトを分類することです。入力は、監視カメラからの画像/ビデオです。オブジェクトを 3 つのクラスに分類する必要があります。1)人間 2)動物 3)その他(車)。一定の背景を考えることができます。

この目的のために、実績のあるアルゴリズム、論文、またはオープンソース コードを提案できる人はいますか? もちろん、グーグルは明らかな解決策ですが、常に経験豊富な目が常に役立ちます!

0 投票する
2 に答える
4893 参照

c# - emgucv で例外「パス tessdata と言語 eng を使用して ocr モデルを作成できません」を解決する方法

C# プロジェクト (道路標識検出システムのプロジェクト) をビルドしようとすると、例外なくビルドおよびデバッグできました。しかし、プロジェクトのメイン インターフェイスでボタンをクリックすると、** という例外がありました。

「パス tessdata と言語 eng を使用して ocr モデルを作成できません。」

強調表示されたコードは

これを解決するのを手伝ってください。どうもありがとうございます

0 投票する
2 に答える
1964 参照

c++ - opencvで移動車両を追跡するための可能な方法

エリアに出入りする車の動きを追跡できるようにする必要があるプロジェクトを行っています。C++ で OpenCV ライブラリを使用しています。すべての機能を検索した後、どの方法を使用すればよいかわかりません。移動はopticalFlowで、入退場は2つの関心領域を設定しようと考えていたのですが、実車の検出方法がわかりません。OpenCVの経験が豊富な人が私に洞察を提供してくれますか?

どんな助けでも大歓迎です。

0 投票する
3 に答える
1867 参照

opencv - ネガティブ サンプルの品質は、haar トレーナーの出力に影響しますか? OpenCV

まず、楽譜から音楽記号を検出しようとしています。たとえば、この場合、このシートhttp://www.anzacday.org.au/で gclef http://upload.wikimedia.org/wikipedia/commons/f/ff/GClef.svgを探しているとします。その他/lastpost.gif .

ポジティブなサンプルとして、1 つの音部記号の画像を使用し、本から本への変更であるすべての可能な形状をカバーするために必要な角度で回転させました。2000 サンプル、haartrainer で 1500 を使用。

ネガティブ サンプルについては、3019 個のランダムな画像をダウンロードして使用しています。もちろん、gclef シンボルがないことを確認した後です。ネガティブなイメージは、雲、オフィス、家、建物、木、ノートパソコンです。実際、stackoverflow でリンクを見つけました。3018 の負のサンプルを使用して、検索させないでください。

ネガティブサンプルは重要ですか?たとえば、私のネガティブ サンプルが雲と家である場合、たとえば音部記号のない楽譜の場合よりも鮮明な結果が得られるでしょうか? つまり、負のサンプルはオブジェクトの検出に影響しますか? 10 ~ 14 ステージの 2 つのカスケード ファイルを既に作成しましたが、非常に異なる結果が得られました。しかし、楽譜を切り取って 3000 のネガティブ サンプルを作成するのは大変です...

私のオブジェクト検出器は実際に動作することを意図しておらず、スキャンされた楽譜でのみ動作するため、検出されるのは音楽記号だけです.Haartrainingがそうでない場合は、指摘してください! n00b を完了し、自分の道を考え出すだけです。

0 投票する
0 に答える
297 参照

javascript - javascript 画像オブジェクトのサポートをテストする必要がありますか?

XMLHttpRequest など、特定の JavaScript オブジェクトのサポートを確保するために、オブジェクト検出の使用を開始しました。Image などの一見どこにでもあるオブジェクトを含む、すべての JavaScript オブジェクトをテストする必要がありますか?

0 投票する
1 に答える
1865 参照

python - opencv_traincascade を使用して haar 分類器を作成する

Haar 分類器の作成に少し問題があります。車を検出するための分類器を構築する必要があります。画像を読み込むPythonでプログラムを作成した瞬間、オブジェクトが存在する領域の周りに長方形を描画します。長方形が描画されると、画像名、長方形の左上と右下の座標が出力されます。ここからどこへ行くべきか、実際に分類器を構築する方法がわかりません。誰でも私に助けを提供できますか?

編集*

opencv_traincascade の使用方法に関するヘルプを探しています。ドキュメントを見ましたが、それを使用して検出プログラムで使用される xml ファイルを作成する方法がよくわかりません。

0 投票する
2 に答える
307 参照

.net - ポイントから複数の(グラフィカルな)オブジェクトのエッジを識別する

ウェブカメラ画像の動きを識別するアプリケーションがあります。次のようなものが生成されます...

ここに画像の説明を入力してください

黒の領域は動きを示します。これは主にピクセルごとに行われます(ただし、近くのピクセルは考慮されます)

だから...各ピクセルの動きがtrue/falseになったので、その情報を使用してオブジェクトの輪郭を識別する必要があります。

欲しいのは次のようなものです。

ここに画像の説明を入力してください

アウトラインは正確である必要はなく、バウンディングボックスを受け入れることができます。両方を組み合わせて表示すると、より目立つノイズの領域もいくつかあります...

ここに画像の説明を入力してください

ご覧のとおり、オブジェクトの外側にいくつかの「動き」ピクセルがあります。おそらく、オブジェクトの最小領域を指定することで、これらを排除します。

したがって、オブジェクトのエッジを識別するためのアルゴリズムは何ですか。理想的には、この情報を使用して、各オブジェクトのおおよその中心を計算できるようになります。

注:@mmgpで説明されているように、上の画像は白黒のものも含めてすべてフルRGBです。これは、エクスポート用の画像を生成する方法によるものです。内部的には、ビット配列です。

0 投票する
1 に答える
1486 参照

c++ - 検出された各オブジェクトの重複した検出をマージする方法は?

HOG 記述子を使用してオブジェクト検出をテストするためのソフトウェアを開発しました。

  • ターゲット オブジェクト クラスのインスタンスを検出するために、ウィンドウ スキャン方式を使用しました。
  • 画像は、さまざまなサイズのオブジェクトを検出するために、さまざまなサイズのスキャン ウィンドウを使用して数回検査されます (マルチスケール検出)。このようにして、各オブジェクトを複数回検出することができます。

各オブジェクトに重複する検出 (位置とサイズが異なる複数の境界ボックス) が存在する場合、同じオブジェクトに関連するすべての検出を含む単一の境界ボックスにそれらを結合する手順が必要です。各オブジェクトの複数の検出をマージする方法は?

0 投票する
0 に答える
1011 参照

opencv - シダの平面オブジェクト検出 OpenCV

平面オブジェクト検出アルゴリズム FERN を実行しようとしています。これが私が使用しているコードです。私の質問は、誰かが私の過ちと、どのようにシダを正しく訓練する必要があるかを教えてくれるかどうかです.

最初に、FAST 特徴検出器の助けを借りて、参照画像のキーポイントを取得しました。これが完了したら、FernDescriptorMatcher を初期化し、キ​​ーポイントを含む画像を追加して、train 関数を呼び出します。何か問題でも?

その後、トレーニングしたオブジェクトを含む別の画像を読み込み、キーポイントを取得して、一致関数を呼び出してそれらを一致させることができます。

私が理解していないのは、一致機能が訓練機能と同じ時間を要し、実行可能な結果がない理由です。では、FernDescriptorMatcher クラスを正しく使用するにはどうすればよいでしょうか。

誰かがそれを正しく使用する方法を教えてもらえますか?