問題タブ [object-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - tessnet2 を機能させる方法が見つかりません
コンソール アプリケーションを作成しました。tessnet2_32 への参照を追加しました。
私もに変更しようとし"C:\temp\tessdata"ました
tessdataフォルダー自体には 9 個のエラーが含まれており、これらの場所すべてに追加されました。
しかし、それは常にその .Init 行にメッセージとともに存在します:
Cしか持っていないのにZディスクにアクセスしようとしている理由が想像できません。または、エラーを完全に誤解しています。
誰かが何をすべきか、および/または私が間違っていることを段階的に投稿するのに十分親切でしょうか? 30以上のGoogleリンクを読んだ後でも、完全に迷っています.
c++ - SURF記述子を使用したminiflann.cppのエラー
私はそのような時期に Opencv を使用してきました。今回、私はとてもイライラする問題に直面しました。実際、私はテンプレート画像を持っていて、一致を使用してカメラストリームでそれを認識したいのですが、次のようなコンソールエラーに直面しています:
実際、これはコードであり、適切にコンパイルされますが、実行時にエラーが表示されます。
前もって感謝します
algorithm - 2D ブロブに四角形をベスト フィットする
バイナリブロブ (画像を参照) があり、既知の幅と高さの四角形をその上に合わせたいと考えています。
最適なフィッティング長方形、つまり、前景ピクセルの最大量が内側にあり、背景ピクセルの最大量が外側にある長方形を見つけるにはどうすればよいですか?
(これはベスト フィットの私の暫定的な定義であり、他の提案も受け付けています)
既知のサイズの長方形を探していますが、任意のサイズの解決策があれば、それも素晴らしいでしょう。
ブロブの例:

これらの長方形を見つけたい:

これまでの私のアイデアが含まれています
- 最小の囲み長方形から始めます。しかし、それはこれらのブロブには適していません
- 囲まれた長方形の最大値。同じ問題に加えて、そのためのアルゴリズムがありません
- ハフ変換で長方形の辺を見つけます。そのためにはデータにノイズが多すぎます。
私の基準に適合する同じブロブに対して複数の長方形が存在する可能性があることを認識しています。理想的には、すべての候補を見つけることができるアルゴリズムが必要です (それはおそらく難しいので、候補を 1 つだけ見つける方法があれば幸いです)。 :

私は主に opencv と cvBlobLib を使用してデータを処理していますが、一般的な解決策についてはオープンです。
matlab - 画像処理における数字認識アルゴリズム・ガイドライン
私は画像処理を学ぼうとしており、その点で目標を設定しています。番号認識システム。
そこで、Alasdair McAndrew の『Matlab によるデジタル画像処理の紹介』を読み、エッジ検出、しきい値処理、膨張と浸食、ヒット アンド ミス変換などについて学びました。
問題は、これらのツールが私の目的にどのように役立つかを視覚化するのに苦労していることです.
私は他にも画像処理に関する本をたくさん持っていますが、それらの本では侵食や膨張の方法を教えてもらっていますが、画像内のオブジェクト、数字、または文字を認識したい場合にどうすればよいかは誰も教えてくれません。
Web で検索すると、この質問に対する非常に一般的で幅広い回答が得られるため、非常にイライラしています。
これらの手法を使用してペイントで自分で作成した画像から数字を認識する方法を教えてください。
多くの本を見た後、私は間違った方向を見ているという印象を受けているので、少なくとも私に本や分野を提案することはできません.
sift - 5 つの画像の Sift 記述子を結合する
同じオブジェクトの 5 つの画像の記述子を 1 つの記述子ファイルに結合して、参照画像のどのビューでもオブジェクトを認識できるようにしたいと考えています。5 つの画像から保存されないように、同様の記述子の繰り返しを排除する必要があります。私が必要とするのは、5 つのビューすべてで、オブジェクトの繰り返されない一意の記述子のセットだけです。どうすれば入手できますか?
object-recognition - 混同行列から ROC グラフへ
私は最近、この論文で説明されているものに基づいて、Bag of Words 分類アルゴリズムを実装しました。
すべてうまくいきますが、ROC 曲線または精度再現率グラフを使用して分類器の精度を測定したいと思います。
各分類子の混同行列を簡単に取得できますが、より多くのポイントを取得して実際に曲線をプロットするには、どのパラメーターを変更する必要があるかわかりません。
誰かが私にこれを説明してもらえますか?
c++ - ステレオ画像でブロブの実際の位置とサイズを見つける
ステレオ画像でブロブまたはオブジェクトのサイズを見つける方法について誰か考えがありますか? ステレオ画像が深度情報を出力することは知っていますが、検出された物体の大きさまたは高さを知りたいです。部屋のさらに奥にある検出されたオブジェクトの周囲に境界長方形を見つけたとします。たとえばセンチメートルなどのメトリックで、その境界長方形の高さを見つけるにはどうすればよいですか?
opencv - Bag of words トレーニング サンプル
Bag Of Words を実装しました。すべてがスムーズに機能しています。しかし、いくつかの手順とその実装方法について混乱しています。
ここに示すように、サンプルを作成するための Bag of words の最後のステップとして、弓の記述子を作成することができましたbowDE.compute(img, keypoints, bow_descriptor);.. 問題は、次のステップについて混乱していることです。
BOW では、非クラス (コーラ) を使用してクラス (車) をトレーニングおよびテストする必要があることを知っています。 . システムをトレーニングしてテストするために私が持っている質問は次のとおりです。
1- bow_descriptor のベクトルを class(cola) 用に半分にし、残りを non-class(cola) 用にするか、または non-class(cola) 用に新しい bow_descriptor を作成する必要がありますか?
2-クラス(車)の最初のシステムを終了した後、マルチクラス分類を行う必要があり、新しいクラス(バス+電車など)をトレーニングする必要があります。それぞれの新しいトレーニングモデルを作成しますか、または以前のトレーニングと一緒にトレーニング手順を実行できますか(つまり、トレーニングクラスBUS、同じシステム内のクラスカーでトレーニングします)?