問題タブ [object-detection]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
8 に答える
51057 参照

c# - 車のナンバー プレート検出に適したアルゴリズムは何ですか?

バックグラウンド

大学での最後のプロジェクトとして、車のナンバー プレート検出アプリケーションを開発しています。私は自分自身を中級プログラマーだと思っていますが、私の数学の知識は中等学校以上のものではなく、正しい数式を作成するのがおそらく必要以上に難しくなっています。

私は、次のような学術論文を調べるのにかなりの時間を費やしてきました。

数学になると、私は道に迷います。このテストにより、さまざまなグラフィック画像が生産的であることが証明されました。たとえば、次のとおりです。

代替テキスト

代替テキスト

ただし、このアプローチはその特定の画像に対してのみ機能し、この手法を別の画像に適用すると、変換が不十分になると確信しています。「ボトムハット形態変換」と呼ばれる式について読んだことがあります。これは次のことを行います。

基本的に、変換は画像のすべての暗い詳細を保持し、他のすべて (より大きな暗い領域と明るい領域を含む) を排除します。

これに関する多くの情報を見つけることはできませんが、レポートの最後近くにある文書内の画像はその有効性を示しています。

その他の制約

  • C# での開発
  • プロジェクトを英国の登録プレートのみに限定する
  • デモンストレーションとして変換する画像を選択できます

質問

どの変換技術の開発に注力すべきか、どのアルゴリズムが役立つかについてアドバイスが必要です。

編集:続きに存在する新しい情報 - 車両のナンバー プレートの検出

0 投票する
3 に答える
9639 参照

c# - 続き-車両のナンバープレートの検出

このスレッドからの続き:

車両のナンバープレートを検出するための優れたアルゴリズムは何ですか?

私はナンバープレートをできるだけ強調するように画像操作技術を開発しました、そして全体的に私はそれに満足しています、ここに2つのサンプルがあります。

代替テキスト

代替テキスト

ここで最も難しい部分があります。実際にナンバープレートを検出することです。いくつかのエッジ検出方法があることは知っていますが、私の計算は非常に貧弱なので、複雑な数式のいくつかをコードに変換することができません。

これまでの私の考えは、画像内のすべてのピクセルをループすることです(imgの幅と高さに基づくループの場合)これから、各ピクセルを色のリストと比較し、これからアルゴリズムをチェックして、色がライセンス間で区別され続けるかどうかを確認しますプレートは白、テキストは黒です。これが当てはまる場合、これらのピクセルはメモリ内の新しいビットマップに組み込まれ、このパターンの検出が停止すると、OCRスキャンが実行されます。

これは欠陥のあるアイデアである可能性があり、遅すぎるか集中的である可能性があるため、これに関するいくつかの入力をいただければ幸いです。

ありがとう

0 投票する
1 に答える
3355 参照

opencv - opencv での迅速なモーションとオブジェクトの検出

急速な動きとオブジェクトを同時に検出するにはどうすればよいでしょうか? 例を挙げましょう.... 1 つのサッカーの試合ビデオがあり、各選手の位置を最大限の精度で検出したいとします。人間の検出について考えていましたが、サッカーの試合のビデオを見ると、人間をオブジェクトと見なすことができるため、人間の検出には何もありません。ブロブ検出でこれを行うことはできますが、ブロブには次のような多くの問題があります。

1) 選手一人一人を分けたい。したがって、プレイヤーが衝突する場合、ブロブ検出は役に立ちません。そのため、プレーヤーを個別に識別する問題があります。2) 2 つ目は、スタジアムのライトの問題です。

これを行うための特定のアルゴリズム、メソッド、またはライブラリはありますか..?私はいくつかの研究論文を見てきましたが、満足していません...記事、アルゴリズム、ライブラリ、方法、研究論文など、これに関連するものを提案してください。

0 投票する
1 に答える
2059 参照

android - opengl Androidでオブジェクト検出を行うには?

私は 2 週間から Android 用の OpenGl を使い始めました。3D の例を試した後、オブジェクト検出に行き詰まりました。基本的に、画面の x、y 座標を 3D 空間の x、y、z に、またはその逆にマッピングします。

私は遭遇しました :

GLU.gluProject(objX、objY、objZ、モデル、modelOffset、プロジェクト、projectOffset、view、viewOffset、win、winOffset);

GLU.gluUnProject(winX、winY、winZ、モデル、modelOffset、プロジェクト、projectOffset、view、viewOffset、obj、objOffset);

しかし、私はそれらを正確にどのように使用するのですか?

適切な例で詳しく説明していただければ、事前に感謝します。:)

0 投票する
1 に答える
4997 参照

image-processing - 方向勾配のヒストグラム

オブジェクト(人間)検出のための HOG 記述子に関する理論を読んでいます。しかし、些細なことのように聞こえるかもしれませんが、実装についていくつか質問があります。

ブロックを含むウィンドウについて。次に示すように、各ステップでウィンドウが重なる位置で、ウィンドウを画像上でピクセルごとに移動する必要があります。ここに画像の説明を入力

または、次のように、重複を引き起こさずにウィンドウを移動する必要があります。ここに画像の説明を入力

これまで見てきたイラストは、2 番目のアプローチを使用していました。ただし、検出ウィンドウのサイズが 64x128 であることを考慮すると、ウィンドウを画像上でスライドさせても、画像全体をカバーできない可能性が高くなります。画像のサイズが 64x255 の場合、最後の 127 ピクセルはオブジェクトのチェック対象になりません。したがって、最初のアプローチはより合理的に見えますが、より多くの時間と CPU を消費します。

何か案は?前もって感謝します。

編集: Dalal と Triggs の元の論文に固執しようとしています。アルゴリズムを実装し、2 番目のアプローチを使用する 1 つの論文は、次の場所にあります

0 投票する
3 に答える
749 参照

opencv - アザラシの子の検出にはどのような記述子を使用すればよいですか?

ビーチから撮影した航空写真でアザラシの子 (動物) を検出してカウントするプロジェクトがあります。アザラシの子は、茶色で大きい大人のアザラシに比べて、黒くて小さいです。

一部のアザラシの子が重なっている/部分的に隠れています。ビーチの色は黄色に近いですが、検出が困難な黒い岩がいくつかあります。

私のプロジェクトに最も適した記述子は何ですか? HOG、SIFT、Haar のような特徴?

この問題の理論部分を求めています。私のプロジェクトを実装するには、最初のステップは、オブジェクトを最も表現できる正しい記述子を選択する必要があると思います。次に、(いくつかの弱い機能を組み合わせる必要はありませんか?)boosting/SVM/neural_network などの機械学習方法を使用して分類器をトレーニングします。 ?

サンプル画像: ここに画像の説明を入力

0 投票する
1 に答える
1281 参照

image-processing - マルチスケールの方向付けられた勾配のヒストグラム(平均シフト?)

私はHOG記述子に取り組んでおり、検出ウィンドウの融合を除いて、ほとんどの部分でほぼ完了しています。

私がこれまでに行ったことは、画像のスケールスペースピラミッドを構築し、各スケールの各画像について、検出ウィンドウ(64x128)を移動して人間を検出します。各画像で、人は複数のウィンドウで検出されます。

したがって、問題は、これらすべてのウィンドウ(1人の場合を想定)を1つのウィンドウにどのように融合するかです。Dalalは、平均シフトなどの堅牢なmod検出アルゴリズムを使用する必要があることを示唆しています。しかし、私は複数のスケールを持っています...それを行うために、最初にスケール空間のより低いレベルで見つかった検出ウィンドウの実際の位置を推定する必要がありますか?

どんな助けでも大歓迎です。前もって感謝します。

0 投票する
1 に答える
361 参照

opencv - OpenCVによる「オブジェクトが上に配置された」検出

私はコンピュータービジョンの分野に不慣れで、次のタスクを解決したいと思っています(できれば、OpenCVとC#を使用しますが、Scilabのような他のソリューションも大歓迎です)。

シーンには手(多かれ少なかれ静的)のような参照オブジェクトがあります-カメラはオブジェクトを見下ろしています。ここで、手に何かがあるかどうか(手の全体的な形が変わるのか、手のひらに座っているのと同じくらい小さいのか)を認識したいと思います。

このタスクはデモンストレーションのみを目的としているため、できるだけ少ない労力で使用したいと思います。静止画でトレーニングして、実際の環境で使用したいと思います。

この問題に取り組むためのヘルプ、ヒント、または手順をいただければ幸いです。前もって感謝します!

0 投票する
2 に答える
3802 参照

opencv - openCV を使用した自然な特徴の追跡 - オプションの評価

簡単に言えば、OpenCv を使用してウェブカメラ フィードで特定の画像 (写真/グラフィック/ロゴ) の追跡を実装するための利用可能なオプションは何ですか?特に、私は次のことについて意見を照合しようとしています:

  1. HaarTraining はやり過ぎでしょうか (3D オブジェクトではなく、単に画像を追跡することを考えると)、それとも唯一の方法ですか?

  2. テンプレート マッチング、色ベースの検出を試しましたが、これらはさまざまな照明/スケール/方向の下で信頼できる追跡を提供しません。

  3. SIFT,SURF 特徴マッチングは、静止画像比較と同様にビデオでも確実に機能しますか?

SO に関する以前のクエリ (非常に役立つ返信) から明らかなように、 OpenCV の比較的初心者です。OpenCV で NFT の実装を開始するための手がかりやリンクはありますか?

0 投票する
1 に答える
3469 参照

kinect - Kinectを使用してオブジェクトを識別することはできますか?

パイロンがパスを決定します。Kinectでパイロンを検出して、ロボットをパス内にとどまらせることができます。Kinectはオブジェクト検出が可能ですか?これに関するチュートリアルはありますか?