問題タブ [feature-detection]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
neural-network - OCRと人工ニューラルネットワークの関係は何ですか?
OCRフォーム認識(データ抽出)について話しているさまざまな記事を見ましたが、フォーム認識を行うためにニューラルネットワークを使用しているとのことでしたが、人工ニューラルネットワーク(ANN)とフォーム認識の関係は何ですか?BusinessCardからフィールドを抽出する場合、ANNを使用する必要がありますか、それともオプションですか?つまり、ANNを使用する必要があるのはいつですか、使用しないのはいつですか。
matlab - MATLABを使用した画像からの特徴検出
画像からの効率的な特徴検出に使用できるアルゴリズムがあることを知りたかったのですが、現在MATLABでSIFTアルゴリズムを使用していますが、結果は良くありません。ですから、誰かが私にMATLABでの作業を容易にするより良いアルゴリズムを提案してくれたら。
opencv - スケール不変の特徴抽出のための SURF と SIFT に代わる高速な方法はありますか?
SURF は SIFT と同様に特許を取得しています。ORB と BRIEF は特許を取得していませんが、その機能はスケール不変ではないため、複雑なシナリオでの有用性が大幅に制限されます。
スケール不変の特徴を SURF と同じくらい速く抽出でき、SURF や SIFT ほど厳密に特許を取得していない特徴抽出器はありますか?
webkit - ユーザーが Webkit ブラウザーを使用しているかどうかを確認するために検出できる特定の Webkit 機能はありますか?
Firefox を検出する必要がある場合は、以下のコードを使用しました。
ユーザー エージェント文字列をチェックせずに Webkit ブラウザーを検出するようなものがあるかどうか興味があります。Webkit ブラウザーだけが持つ特定の機能をチェックするようなものですか?
java - バイナリイメージから複数の特徴を抽出するメソッドを実装する方法
私はJavaで簡単なコンピュータビジョンシステムを実装しています。画像から形状を抽出します。これは一般的に円形または楕円形です。分析したい特徴だけで構成されるバイナリイメージを作成できるようになりました。画像内の白いピクセルの数を数えることで、単一の特徴の領域を簡単に見つけることができます。ただし、複数の機能がある場合は、すべての機能を組み合わせた領域が見つかります。
誰かが複数の特徴を抽出/検出する方法を実装する方法を知っているだろうかと思っていたので、それぞれの領域などを簡単に見つけることができました。
openCVでこれを行う方法についての情報を見つけましたが、実際にメソッドを実装する方法についての情報、またはそれを実現する方法の背後にある理論さえも見つけることができません。単純な例でさえ、それほど高度である必要はありません。大丈夫だろう。
アドバイスをいただければ幸いです。
c++ - OpenCV C と C++
SURF を使用しようとしていますが、C でその方法を見つけるのに問題があります。ドキュメントには、C++ に関するものしかないようです。
SURF 機能を検出できました。
しかし、2 つの画像の記述子を比較するために必要な方法が見つかりません。C++ でこのコードを見つけましたが、翻訳に問題があります。
誰かが私を記述子マッチャーに導くことができれば幸いです.CのみでOpenCVのドキュメントを見つけることができる場所を教えてください.
java - Java で形状の特徴を抽出するフーリエ変換とフーリエ記述子
フーリエ記述子を使用して単純な形状を認識する単純なシステムを構築しようとしています: プログラムで高速フーリエ変換のこの実装を使用しています: (以下のリンク)
http://www.wikijava.org/wiki/The_Fast_Fourier_Transform_in_Java_%28part_1%29
入力は次のとおりです。実数とimagの部分(基本的に、私が持っている境界パラメーターのx、y座標です)と出力は、変換された実数とimagの数値です。
質問: 出力 (変換された real,imag ) を単純な形状の不変記述子として使用するにはどうすればよいですか?
これは私が考えたことでした:
R = sqrt( real^2 + imag^2 )
N ステップごとに 計算します。R
それぞれをR[1]
= 正規化係数で割り、不変にします。
問題は、わずかに異なる画像 (わずかな回転が適用されているなど) に対して非常に異なる R 値が得られることです。
言い換えれば、
私の記述子は不変ではありません... R値の取得に何か問題があると思います。
opencv - サイズと応答は、SURFキーポイントで正確に何を表していますか?
キーポイントの検出と照合にOpenCV2.3を使用しています。しかし、私は検出アルゴリズムによって与えられたパラメータsize
とと少し混乱しています。response
それらは正確にはどういう意味ですか?
OpenCVのマニュアルに基づいて、私はそれを理解することができません:
float size
:意味のあるキーポイント近傍の直径
float response
:最も強力なキーポイントが選択された応答。さらなるソートまたはサブサンプリングに使用できます
追跡するのに最適なポイントは、応答が最も高いポイントだと思いましたが、そうではないようです。では、サーフディテクタによって返されるキーポイントのセットをサブサンプリングして、追跡可能性の点で最良のものだけを維持するにはどうすればよいでしょうか。
matlab - Mikolajczykの評価フレームワークを機能検出器/記述子に使用するにはどうすればよいですか?
Mikolajczyk et。によるデファクトスタンダードフレームワークを使用して、SURF記述子の実装の正確さを評価しようとしています。al。私はOpenCVを使用してSURF機能を検出および記述し、記述子実装への入力と同じ機能位置を使用しています。
記述子のパフォーマンスを評価するには、フレームワークで最初に検出器の再現性を評価する必要があります。残念ながら、再現性テストでは、各フィーチャの周囲の画像領域のサイズと方向を定義する楕円パラメータとともに、フィーチャの位置のリストが必要です。ただし、OpenCVのSURF検出器は、フィーチャの位置、スケール、および方向のみを提供します。
関連する論文は、2次モーメント行列の固有値からこれらの楕円パラメーターを繰り返し計算することを提案しています。これが唯一の方法ですか?私が見る限り、これにはOpenCVをいじる必要があります。後で(Matlabなどで)これらの楕円パラメーターを機能リストと入力画像から計算する方法はありませんか?
誰かがこのフレームワークを使って作業したことがあり、洞察や指針を手伝ってくれる人はいますか?
android - 「リストを渡す」objectKeypoints" jobject を Vector にネイティブコードで
私は現在、Androidアプリケーションに取り組んでいます。Java 側では、aList<KeyPoint> objectKeypoints
をネイティブ コードに渡します。しかし、ネイティブ側でこのジョブジェクトVector<Keypoint> objectKeypoints
をさらに処理するために変換するにはどうすればよいですか。
例: Java 側の呼び出し方法:
ネイティブ サイドの C++ コード。