問題タブ [image-segmentation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 平均シフトを使用した画像セグメンテーションの説明
平均シフトセグメンテーションが実際にどのように機能するかを理解してくれる人はいますか?
これは、私が作成したばかりの8x8マトリックスです
上記のマトリックスを使用して、平均シフト セグメンテーションが 3 つの異なるレベルの数値をどのように分離するかを説明できますか?
opencv - Mixture of Gaussians opencv 実装の使用方法に関するチュートリアル/優れたドキュメントはありますか?
CvGaussBGStatModelParams 構造体、cvCreateGaussianBGModel、およびその他の関連関数を使用する OpenCV コードを見つけました。ただし、それらがどのように機能し、どのように使用され、何を意味するかについての説明を見つけることができませんでした。
どんな助けでも大歓迎です。
image-processing - 最高のセグメンテーション アルゴリズム
テクスチャ、形状、色などの基本的な特徴に基づいて、画像に存在するさまざまなオブジェクトを認識するシステムを開発しようとしています。
このプロセスの最初の段階は、画像から個々のオブジェクトを抽出し、後でそれぞれに対して画像処理を行うことです。
しかし、私がこれまでに研究してきたセグメンテーション アルゴリズムは、理想的なイメージ セグメンテーション アルゴリズムと呼ばれる完全なものではありません。
セグメンテーションの精度によって、システムが特定のクエリにどれだけうまく応答するかが決まります。
セグメンテーションは、高速かつ正確でなければなりません。
これまでに開発または実装されたセグメンテーション アルゴリズムを提案できますか?
どんなヘルプでも大歓迎です..
opencv - 画像セグメンテーション技術
私はコンピュータービジョンアプリケーションに取り組んでおり、概念的な障害に悩まされています。ビデオ内の一連のロゴを認識する必要があります。これまで、SIFT(およびYuとMorelによるASIFT)、SURF、FERNSなどの機能マッチング方法を使用してきました。基本的には「汎用記述子マッチャーの共通インターフェイス」のすべてです。 OpenCVドキュメントのセクション。しかし最近、私はOCR /ランダムツリー分類器で使用される方法を研究しており(私はこのデータセットで遊んでいました:http://archive.ics.uci.edu/ml/datasets/Letter+Recognition )、これがより良いかもしれないと考えていますロゴを見つける方法。問題は、任意の画像を自動的にセグメント化する信頼できる方法が見つからないことです。
私の質問:
- 記述子/キーポイント以外の方法をわざわざ調べる必要がありますか、それともこれが典型的なロゴ(様式化された、少数の色、鋭いエッジ)を認識するための最良の方法ですか?
サンプルデータベースと適切に照合できるように、任意の画像(または私の場合はビデオフレーム)をセグメント化するにはどうすればよいですか?- HaarCascadesは同様の方法(サンプルのデータベース)で機能しているように見えますが、プロセスがどのように関連しているかを理解することはできません。そこでセグメンテーションが行われていますか?
申し訳ありませんが、これらの質問は広すぎます。私は少しの助けを借りてこのようなものに頭を包み込もうとしています。ありがとう!
matlab - Matlab で文字のセグメンテーションを実行する方法
ナンバー プレートの画像があり、数字を 1 つずつ切り取りたい。
誰もそれを実行する方法を簡単に考えていますか?
ウェブを検索した後、水平方向と垂直方向のスミアリングの操作を行う方法を見つけましたが、それが何を意味するのか本当にわかりません。
どんな説明でも役に立ちます
前もって感謝します。
matlab - コードの説明 - Matlab
このコードは、Matlab の画像から文字のセグメンテーションを実行することを想定しています。コードは Lucas から提供されたので、Lucas に感謝します。
問題は、文字のセグメンテーションがどのように行われるかを正確に理解したいということです。理解するまでは使用したくありません。
誰か説明してくれませんか...ありがとう。
ルーカス コード:
iphone - 画像内の特定のオブジェクトの検出、つまりopencvによる画像セグメンテーション
i-phoneの画像に表示されている特定のオブジェクトを選択する必要があります。基本的に私のプロジェクトは、私のタッチに基づいて画像オブジェクトをセグメント化することです。
私が従う方法は、最初に画像の輪郭を検出し、次に指のタッチに基づいて特定のシーケンスを選択することです。ビデオフレームで実行する必要があるため、より堅牢な方法は他にありますか?
プロジェクトにはOpenCVとiphoneを使用しています。実装されている、または実装が可能な他のアイデアがある場合は、助けてください。
image-processing - 誰でも cvWatershed() 関数について詳しく教えてください
cvWatershed() は、Iplimage *src_image と CvArr* マーカーの 2 つの引数を取ります。
タッチに基づいて画像をセグメント化する必要があるため、誰でもマーカー引数について詳しく説明できますか?タッチに基づいてマーカー配列をリアルタイムで形成し、cvWatershed を呼び出すことができますか?
matlab - Matlab を使用してオブジェクト上に四角形を描画します
コイン画像を含む画像があります。コインの形状は、長方形、正方形、円、楕円形などです。コインの上に長方形を描き、コインを背景からセグメント化したいと思います。コインは画像のどこにでもある可能性があるため、長方形の x または y の値を指定することはできません。誰もこれを行う方法を知っていますか?
image - 画像減算によるセグメンテーションのための最適化アルゴリズム
OpenCVのプロジェクトでは、もちろんノイズを最小限に抑えながら、移動するオブジェクトを可能な限り適切にセグメント化したいと思います。
このために、画像減算アルゴリズムを使用したいと思います。私はすでに実行中のプログラムを持っていますが、今日、十分に公平な結果を得る方法を見つけられませんでした。
私はすでに次の(グレースケール)画像を与えています:
これまで、可動部分を取得するために、cvSub();
現在のフレーム画像と最後のフレームを差し引くことを試みました。cvAbsDiff();
しかし、残念ながら、私はまだそこにたくさんのノイズを受け取ります(つまり、風が強いときに木がわずかに動くため)、動くオブジェクトが非常に大きく、ホモジェニックな色をしている場合(たとえば、白または黒のシャツを着た人)、減算人の左側と右側の画像の変化のみを検出し、体自体は検出しないため、1つのオブジェクトが2つのオブジェクトとして検出されることがあります...
このノイズを取り除くために、画像を侵食して拡大しようとしましcvErode()
たcvDilate()
が、これは非常に遅く、画面上の移動するオブジェクトが小さい場合、侵食によってオブジェクトの大部分が削除されるため、縮小した後、常に取得できるとは限りません。良い結果または分割されたオブジェクト。
この後、cvFindContours()
輪郭を取得し、サイズを確認し、サイズが収まるかどうかを確認して、移動するオブジェクトの周りに長方形を描きます。ただし、セグメンテーションが不適切なためにオブジェクトが複数の長方形に分割されることが多いため、結果は良くありません。
友人から、次の2つ以上のフレームを減算に使用してみると、ノイズがすでに減少している可能性があると言われました...しかし、彼が何を意味しているのか、フレームを追加/減算して取得する方法がわかりません。ほとんどノイズがなく、十分な大きさのオブジェクトブロブを示す画像。
誰かがそれを手伝ってくれる?複数のフレームを使用して、ノイズを最小限に抑えながら、移動するオブジェクトに十分な大きさのブロブを備えた画像を取得するにはどうすればよいですか?私はどんなヒントにも感謝します...
追加:
私はここに現在のビデオをアップロードしました:http://temp.tinytall.de/多分誰かがそこでそれを試してみたいと思っています...
これはそのフレームです。左側の画像はcvFindContours()の結果を示し、右側の画像はセグメント化された画像であり、その上で輪郭を見つけようとしています...
つまり、1つの大きなオブジェクトは、十分に速く動いている場合は正常に機能します...つまり、自転車です。しかし、人を歩いていると、必ずしも良い結果が得られるとは限りません...何かアイデアはありますか?