問題タブ [image-segmentation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 任意の数のネイバーを持つCFGを解析する方法は?
画像の解析に文脈自由文法を使用しようとしているプロジェクトに取り組んでいます。画像セグメントのツリーを構築し、機械学習を使用してこれらの視覚的な文法を使用して画像を解析しようとしています。
理想的に見えるSVM-CFGを見つけました。問題は、文字列の各端末に最大2つの隣接語(前後の単語)がある文字列解析用に設計されていることです。私たちの視覚的な文法では、各セグメントは任意の数の他のセグメントの隣に置くことができます。
これらの視覚的な文法を解析するための最良の方法は何ですか?具体的には、SVM-CFGを使用するようにデータをエンコードできますか?または、独自のカーネル/解析ライブラリを作成する必要がありますか?
matlab - このアルゴリズムを matlab で実装する方法
私は虹彩認識システムに取り組んでいます。を使用して画像内の連結成分を分析して瞳孔を見つけたいと思いますbwconncomp
。
瞳孔検出のアルゴリズムは次のとおりです。
- 連結成分のラベル付けは、画像をスキャンすることによって機能します。ピクセルの接続性に基づいて、ピクセルをコンポーネントにグループ化します。連結成分内のすべてのピクセルは、同様のピクセル強度値を共有し、何らかの方法で相互に連結されています。
- ピクセルのすべてのグループが決定されると、そのグループ内の各ピクセルにラベルが付けられます。すべてのグループの中心と直径が決定され、最大の直径を持つものが瞳孔です。
- 虹彩の上下にある画像の部分は、まつ毛とまぶたによって遮られています。これらのピクセルは、瞳孔の直径の上下にあります。それらを削除するには、これらのピクセルを NaN (非数値) に設定します。
- 最小/最大アイリス半径は 90/125 であることがわかっています。これに基づいて、瞳孔の左右 45 ピクセルが、提案されたアルゴリズム分析の虹彩領域であると見なされます。
私の質問は、虹彩の上下のスペースを NaN に設定するにはどうすればよいかということです。また、虹彩に対応するピクセルを取得するにはどうすればよいですか?
私のコードは次のとおりです。
image - 画像からオブジェクトを抽出する方法
画像から人や車などのオブジェクトを抽出したいのですが、画像は通常の画像であり、特定の目的のための医療画像やその他のタイプではありません。
私は長い間検索してきましたが、自動画像セグメンテーション アルゴリズムは画像を一連の領域にセグメント化するか、セマンティック オブジェクトではなく画像の輪郭を与えるだけであることがわかりました。そこで、インタラクティブな画像セグメンテーション アルゴリズムに目を向けると、インタラクティブなグラフ カットや SIOX などの一般的なアルゴリズムを見つけました。これらのアルゴリズムはまさに私の要求を満たしていると思います。
さらに、2 つのインタラクティブな画像セグメンテーション ツールもダウンロードしました。1 つ目はインタラクティブ セグメンテーション ツール、2 つ目はインタラクティブ セグメンテーション ツールボックスです。
だから私の質問は
1.パフォーマンスが最も重要であるため、インタラクティブな画像セグメンテーションアルゴリズムが私のタスクに適したソリューションである場合。
2. 自動画像セグメンテーション アルゴリズムを使用したい場合、次に何をすればよいですか?
matlab - 画像を文字セグメントに変換する方法は?
多くの場合、OCRのプロセスでは、画像ファイルは基本的にセグメントにカットされ、各文字はそれぞれセグメントとして認識されます。例えば、
次のようなものに変換する必要があります
また、この目的ですぐに利用できるテルグ語のようなアジア言語のアルゴリズムはありますか?そうでない場合、これは英語でどのように行われますか?
css - 伸縮性のあるセグメント化されたフッターの誤動作。与えられたコンパクトなライブの例
曲線が画像であるブラウザー ウィンドウの下部に、曲線の形をした伸縮性のあるフッターを固定する必要があります。ライブの例をモックアップしました。
フッター画像の透明な部分による下層の「クリック可能な」不動産の損失を最小限に抑えるために、私の本能は、画像をいくつかのセグメント(例では赤いボックス)に切り取り、次のように並べて配置することです。
ほとんどの主要なブラウザー (IE と FF を除く) では、ウィンドウのサイズが変更されると、ボックス間でヘアライン フラクチャが発生したり、発生したりしますが、これは容認できません。
画像セグメントをフローティングすると問題は解決しますが、フッターを下部に固定し、前述の「クリック可能性」を維持する実装方法は見つかりませんでした。この問題に対する私よりも優れたアプローチはありますか、それとも何らかの方法で修正できますか?
例に関する注意: 例の曲線イメージ自体はまだカットされておらず、まだ 1 つのイメージです。また、青いボックスは問題ありません。伸びないため、問題の影響を受けません。
この動作の理由と実行可能な解決策の両方に興味があります。ありがとう。
image-processing - 色とサイズに基づいてオブジェクトをセグメント化する方法は?
Open-CV を使用して処理している画像処理の問題が 2 つあります。
- 互いに離れた異なる色の類似オブジェクトを識別します。
- 互いに離れた異なるサイズの同系色のオブジェクトを識別します。
シナリオ 1 と 2 のサンプル画像。
1
2
どちらの画像にも 3 種類の対象物があります。(3色または3サイズのいずれか)
私が遭遇した手法には、しきい値処理と、ピクセル カウントによる侵食の使用、RGB 値を使用したカラー セグメンテーションが含まれます。
適切なワークチェーンとは何か、開始するのに適した場所は何か?
c# - emgu両手検出
両手を検出したい (HSV フィルター画像を使用)。
問題は、両手を合わせると頭が間に入り、手が認識できないことです。
アプリケーションの起動時に Haar を使用して 2 つの手を検出し、画像を HSV (白黒) に変換します。次に、セグメンテーションを使用してオブジェクトの中心質量を検出し、それらを追跡できるようにします。面積が十分に小さいオブジェクトを却下します。
どうすればこの問題を解決できますか?
c++ - OpenCV:しきい値処理を使用して画像を適切にセグメント化するにはどうすればよいですか?/バイナリ画像を使用して元の画像をセグメント化するにはどうすればよいですか?
現在、マンモグラフィーを使用したプロジェクトを開発しており、画像を検索可能領域 (ROI) と検索不可能領域の 2 つのセクションに分割する方法を理解しようとしています。この質問の焦点は、実際の画像分析/処理の基礎となるアルゴリズムのみに向けられています。Google と Stack Overflow からの結果のほとんどは有益な情報をもたらしましたが、画像分析/処理の手順、これらの手順が重要な理由、およびそれぞれが正確に何をしているのかを説明するものはありません。
画像を取得し、画像のサイズを変更し、画像を「バイナリ化」する小さなコード セグメントを作成しました。(以下。) バイナリ イメージで線 (等高線?) をトレースし、この線を元のイメージに移動し、それをガイドラインとして使用して、アルゴリズムで非検索領域 (ROI) を決定する方法はありますか?検索可能なエリア?これを行う簡単な方法はありますか?
明確化と繰り返しのために、私はかなりの数のチュートリアルを調べましたが、具体的には何も役に立ちませんでした. 私が得ることができるすべての助けに感謝します!
opencv - OpenCV - 2 つのバイナリ イメージ間の交差
同じサイズの 2 つのバイナリ イメージがあるとします。2 つのバイナリ イメージの交点を見つけるにはどうすればよいですか? 2 つの画像で同じ座標 (位置) の白 (グレー - 255) のピクセルのみが、出力画像 (交点) で白のピクセルになります。
image-processing - Haralick のラベル付けアルゴリズムの適切な説明
Haralick のラベル付けアルゴリズム (序文と後方反復を含む) をどのように説明しますか?