問題タブ [computer-vision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
8831 参照

python - OCRトランプ

トランプの画像を入力してランクとスーツを返したいという楽しみのプロジェクトをやろうと思いました。左上隅にすべての情報があるので、左上隅を見るだけでよいと思います。堅牢である必要があります。AceofDiamondsの大きな画像がある場合は、20〜200%の範囲で拡大縮小でき、それでも正しい答えが得られるはずです。

最初の質問-これを行うためにすでに書かれたものはありますか?もしそうなら、私はOCRに何か他のものを見つけるので、私は努力を複製しません。

第二に-これを行うための最良の方法は何ですか?神経網?何か手作業でコーディングしましたか?誰かがポインタを与えることができますか?(0xCAAF9452は受け入れ可能な答えではありません)。

0 投票する
5 に答える
2690 参照

c++ - イメージ シフトの検索

プログラミング言語vb.net、C++、またはC#を使用して、同じ2つの画像間のシフトと回転を見つける方法は?

0 投票する
4 に答える
36875 参照

image-processing - ハフ変換による長方形検出

この論文に基づいて 、ハフ変換を使用して長方形検出を実装しようとしています。

Matlab を使用してプログラムしましたが、平行ペア線と直交ペア線を検出した後、これらのペアの交点を検出する必要があります。私の質問は、ハフ空間における 2 つの線の交点の質についてです。

4 つの方程式系を解いて交点を見つけました。これらの交点はデカルト座標空間または極座標空間にありますか?

0 投票する
2 に答える
11332 参照

opencv - OpenCV:ビデオフィードで点滅するライトを検出する

ビデオフィードがあります。このビデオフィードには、さまざまな速度で点滅するいくつかのライトが含まれています。すべてのライトは同じ色です(すべて赤外線LEDです)。これらの点滅するライトの位置と頻度をどのように検出できますか?

免責事項:私はOpenCVに非常に慣れていません。私はLearningOpenCVのコピーを持っていますが、それは少し圧倒されます。誰かがOpenCVの用語で解決策を説明できれば、それは大いにありがたいです。私は私のためにコードが書かれることを期待していません。

0 投票する
4 に答える
4637 参照

algorithm - エッジ検出/画像認識について学び始めるのに最適な記事

私は、エッジ検出と画像セグメンテーション/オブジェクト認識に関するかなり広範な知識を必要とする個人的なプロジェクトに携わっています。

コードを書く前に計画/理解することの重要性を知っています。これを念頭に置いて、コンピューティングのこれらの領域について学ぶために、どこから始めるのが最適ですか? 理想的には、オンラインの記事/論文を探しています。

ありがとう

0 投票する
2 に答える
16186 参照

computer-vision - ステレオ画像から深度マップを取得するライブラリ?

リアルタイムの3Dモーショントラッキングを実行するようにいくつかのデバイスをセットアップします。私が最初に考えたのは、カメラのペアを使用してステレオ画像を撮影し、深度マップを計算して必要な3Dデータを取得することです。

利用可能な優れたオープンソースライブラリ(C / C ++)はあり、リアルタイム(〜12-24fps)に十分な速度がありますか?私はSourceForgeでステレオビジョンEStereoを使用した3D再構築を見つけましたが、誰かがそれらを試しましたか?

または、実装できるアルゴリズムの提案はありますか?

0 投票する
1 に答える
6655 参照

c# - ハフ変換の質問

C# でハフ変換を次のように実装しました。

したがって、私の理解では、すべての曲線の交点のシータと半径を見つけました。では、どうすれば実際の行を見つけることができますか?

勾配と点を見つける必要があると主張する人もいますが、今何をすべきかははっきりしていません。

助けてくれてありがとう、ジョナサン

0 投票する
2 に答える
1550 参照

image-processing - OCR-最も「異なる」または「認識可能な」ASCII文字?

最も「異なる」または「認識可能な」NASCII文字を判別する方法を探しています...たとえば、N = 10の場合、0x21から0x7EまでのASCIIセットで最も異なるN文字は何でしょうか。明らかに、文字「X」は「O」(文字)とは非常に異なりますが、「O」(文字)は「0」(ゼロ)に非常に似ています。ゼロと文字Oがどちらか一方としてのみ検出され、それがゼロか文字Oかを心配する必要がないなど、制限されたOCR文字サブセットを想定すると、最も異なるNは何になりますか一般的なOCRエンジン(Tesseractなど)が低品質の入力画像から簡単に認識できる文字はありますか?仮定。「+」や「t」などは、大きく誤解される可能性があります。作ることができます、

ありがとう、ベン

0 投票する
5 に答える
10877 参照

python - 簡単な物体認識

===解決済み===

ご提案とコメントをありがとうございます。Beginning Python Visualization book (第 9 章 - 画像処理) に記載されている flood_fill アルゴリズムに取り組むことで、私が望んでいたものを実装しました。オブジェクトを数え、各オブジェクトを囲む四角形を取得し (したがって、高さと幅)、最後にそれぞれの NumPy 配列または行列を作成できます。

最適化されたアプローチではありませんが、私が望むことはできます。私が使用するソース コード (lab2.py) と png ファイル (lab2-particles.png) は、http: //code.google.com/p/ccnworks/source/browse/#svn/trunk/AtSc450 に配置されています。 .

ヒストグラムを表示するには、NumPy と PIL がインストールされており、matplotlib が必要です。コードのコアは、主な再帰的なオブジェクト検索アクションが発生する objfind 関数内にあります。

もう1つの更新:

SciPy のndimage.label()も、私が望んでいることを正確に実行します。

NumPy および SciPy メーリングリストのDavid-Warde FarleyZachary Pincusに乾杯、これを私の目に向けてください :)

=============

こんにちは、

粒子分光計で測定された氷の粒子の影を含む画像があります。後で分類して計算でさらに使用できるように、各オブジェクトを識別できるようにしたいと考えています。

本質的に、私がやりたいことは、各エンティティを簡単に選択できるファジー選択ツールを実装することです。

どうすればこの問題を簡単に解決できますか? (できればPythonを使用してください)

ありがとう。

注: 私の質問では、特定の接続された各ピクセルをオブジェクトまたはエンティティと呼んでいます。以下に示すように、それらを抽出して NumPy 配列表現を作成するという私の意図。(ここでは左上のオブジェクトを使用しています。ピクセルが存在する場合は 1 を使用し、存在しない場合は 0 を使用します。このオブジェクトの形状は 3 x 3 で、対応して高さ 3 ピクセル、幅 3 ピクセルです。これらは、2D ドメインへの実際の氷粒子の投影です。 、それらが球状であり、同等の半径が (高さ + 幅)/2 であるという仮定の下で、後でいくつかのスケーリング -- ピクセルから実際のサイズまで、および体積の計算が続きます)

これは、使用する画像の一部です。

スクリーンショット http://img43.imageshack.us/img43/2327/particles.png

0 投票する
7 に答える
3811 参照

c - エッジ検出器の出力から短い線分を削除していますか?

エッジ検出器の出力から短い線分を削除するアルゴリズムを探しています。下の画像 (およびリンク) に見られるように、「長い」線ではないいくつかの小さなエッジが検出されています。理想的には、処理後に四角形の 4 辺だけが表示されるようにしたいのですが、いくつかのはぐれた線がある場合、それは大したことではありません... 何か提案はありますか?

例

画像リンク