問題タブ [computer-vision]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 簡単な物体認識
===解決済み===
ご提案とコメントをありがとうございます。Beginning Python Visualization book (第 9 章 - 画像処理) に記載されている flood_fill アルゴリズムに取り組むことで、私が望んでいたものを実装しました。オブジェクトを数え、各オブジェクトを囲む四角形を取得し (したがって、高さと幅)、最後にそれぞれの NumPy 配列または行列を作成できます。
最適化されたアプローチではありませんが、私が望むことはできます。私が使用するソース コード (lab2.py) と png ファイル (lab2-particles.png) は、http: //code.google.com/p/ccnworks/source/browse/#svn/trunk/AtSc450 に配置されています。 .
ヒストグラムを表示するには、NumPy と PIL がインストールされており、matplotlib が必要です。コードのコアは、主な再帰的なオブジェクト検索アクションが発生する objfind 関数内にあります。
もう1つの更新:
SciPy のndimage.label()も、私が望んでいることを正確に実行します。
NumPy および SciPy メーリングリストのDavid-Warde FarleyとZachary Pincusに乾杯、これを私の目に向けてください :)
=============
こんにちは、
粒子分光計で測定された氷の粒子の影を含む画像があります。後で分類して計算でさらに使用できるように、各オブジェクトを識別できるようにしたいと考えています。
本質的に、私がやりたいことは、各エンティティを簡単に選択できるファジー選択ツールを実装することです。
どうすればこの問題を簡単に解決できますか? (できればPythonを使用してください)
ありがとう。
注: 私の質問では、特定の接続された各ピクセルをオブジェクトまたはエンティティと呼んでいます。以下に示すように、それらを抽出して NumPy 配列表現を作成するという私の意図。(ここでは左上のオブジェクトを使用しています。ピクセルが存在する場合は 1 を使用し、存在しない場合は 0 を使用します。このオブジェクトの形状は 3 x 3 で、対応して高さ 3 ピクセル、幅 3 ピクセルです。これらは、2D ドメインへの実際の氷粒子の投影です。 、それらが球状であり、同等の半径が (高さ + 幅)/2 であるという仮定の下で、後でいくつかのスケーリング -- ピクセルから実際のサイズまで、および体積の計算が続きます)
これは、使用する画像の一部です。
スクリーンショット http://img43.imageshack.us/img43/2327/particles.png
c - エッジ検出器の出力から短い線分を削除していますか?
エッジ検出器の出力から短い線分を削除するアルゴリズムを探しています。下の画像 (およびリンク) に見られるように、「長い」線ではないいくつかの小さなエッジが検出されています。理想的には、処理後に四角形の 4 辺だけが表示されるようにしたいのですが、いくつかのはぐれた線がある場合、それは大したことではありません... 何か提案はありますか?
image-processing - ビジョンと画像分析を行うプロジェクトの良い例はありますか?
一連のガラス試験管の画像を撮影し、チューブ内の液体のレベルまたは液体がチューブの底に到達するポイントのいずれかを自動的に示す必要があります。画像はおそらくウェブカメラで収集され、標準のPCで処理されます。言語や方法に制限はありませんが、それが何であれ、学ぶ必要があります。
私は、VisiononSOに関するこれらのより一般的な質問を見つけました。
- コンピュータビジョンについて学ぶ、
- what-is-the-best-library-for-computer-vision-in-cc、
- open-source-machine-vision-libraries、
- where-do-i-start-learning-about-image-processing-and-object-recognition、
私がレビューできるように十分に文書化されている同様のプロジェクト、または他のアイデア/コメントを知っている人はいますか?
open-source - ヘビまたは流域セグメンテーションアルゴリズムのオープンソース実装はありますか?
私は、セグメンテーションアルゴリズムの比較分析を実行することを目標とする卒業プロジェクトで働いています。
私が参加した学部の研究プロジェクトでは、C ++でいくつかのセグメンテーションアルゴリズムを実装しました(たとえば、大津の方法とEM / MPMアルゴリズム)。
実装したアルゴリズムをヘビと流域のセグメンテーションと比較することを計画しています。ただし、これらのアルゴリズムを実装することは私の意図ではありません。それで、それらのアルゴリズムを実装するオープンソースの画像処理ライブラリがあるかどうかを知りたいのです。実装がC/C ++であるとよいでしょうが、Java、Pythonなども問題ありません。
matlab - SIFTアルゴリズムを使用して、2つの画像がどの程度類似しているかを計算するにはどうすればよいですか?
Andrea VedaldiのSIFT実装を使用して、2つの類似した画像のふるい分け記述子を計算しました(2番目の画像は、実際には同じオブジェクトを異なる角度から拡大した画像です)。
今、私は記述子を比較して画像がどれほど似ているかを知る方法を理解することができませんか?
こういうことを実際にやってみないと答えられないことは知っていますが、これまでにやったことがある人も知っているのではないかと思い、質問を投稿しました。
記述子を生成するために私がしたこと:
math - 地域の第二の瞬間とは?
私は現在、Matlab の regionprops 関数の機能の一部を Octave に複製する作業を行っています。ただし、機能のサブセットに少し問題があります。「偏心」、「MajorAxisLength」、「MinorAxisLength」、および「Orientation」プロパティは、私のこだわりです。ドキュメントでは、それらはすべて「...領域と同じ秒モーメントを持つ楕円」から派生しています。
だから私の質問は、これらのセカンドモーメントとは何ですか、どうすればそれらを見つけることができますか?
私はこのリンクを見ていました: http://en.wikipedia.org/wiki/Image_moments
正直なところ、それは私をより混乱させただけです。誰かがもう少し初心者に優しいものを教えてもらえますか? ありがとう。
computer-vision - ロボティクスとコンピューター ビジョン
数人の友人と私は、黒い表面の白い線を追跡する単純なロボットを構築します。この種のことはこれまでに行ったことがなく、非常に高度な攻撃計画を立てています。
すべてのコンピューティング ニーズに対応するミニ atx ボード、道路を追跡するための Web カメラ、および推進用と方向用の 2 つの電気モーターを入手してください。
私の主な関心事は、道路を追跡するためのより良い方法はありますか? または、ウェブカメラは仕事に適していますか?
編集:
フォトレジスタを使用した回答のフォローアップが進むべき道のようですが、もう 1 つ質問があります。トラックの右側に信号があり、ロボットにどちらの方向に曲がるかを伝えます。再び黒地に白。T字路を左折しなければならないなど。カメラなしでこれを処理する方法はありますか?
image-manipulation - 2D 画像のテクスチャを「塗りつぶす」アルゴリズム
しばらく前に、画像の一部から画像の別の部分にテクスチャを自動的かつシームレスに「移植」できるアルゴリズムについての論文を見たことを思い出します。
アプローチは、次のようなものでした。
存在する画像の部分から、ピクセルの小さな正方形 (おそらく 8X8) のデータベースを構築します。
次に、空のピクセル (テクスチャ移植の「宛先」) を選択して塗りつぶし、周囲のピクセルに最もよく一致する正方形の 1 つをデータベース内で探します。次に、見つけた正方形の対応するピクセルの色に従って、空のピクセルに色を付けます。次に、別の空のピクセルを選択し、空のピクセルがなくなるまで繰り返します。
もちろん、これは漠然とした説明にすぎません。なぜなら、詳細の記憶をリフレッシュするためのこのアルゴリズムへの参照が見つからないからです! 誰でも助けることができますか?
c++ - OpenCVでRGBを白黒に変換
RGB 画像を白黒 (バイナリ) 画像に変換する方法を知りたいです。
変換後、変更した画像をディスクに保存するにはどうすればよいですか?
image - エッジ検出と透明性
一定の背景で撮影した衣料品の画像を使用して、衣料品を除く画像のすべてのピクセルを透明にします。これを行うための最良の方法は何ですか?私はこれとオープンソースライブラリopencvに共通するアルゴリズムを研究しました。自分でローリングしたり、opencvを使用したりする以外に、これを行う簡単な方法はありますか?私はどんな言語やプラットフォームにもオープンです。
ありがとう