問題タブ [pattern-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
geometry - 閉じた/開いた形状を形成する2つの方向ベクトル間の角度を計算する方法は?
私は正しいトリガーを理解しようとしています。以下を決定するための式/関数: 2 つの線分を表す 2 つの方向ベクトル (既に決定されている) 間の角度変化 (度単位) 。これは、SHAPE RECOGNITION (ユーザーが画面上に手書きしたもの) のコンテキストで使用されます。
だから基本的に、
a)ユーザーが円、楕円、長方形などの(大まかな)形状を描く場合、その形状を構成する線は、20ポイント(xyペア)に分解されます。
b) これらの LINE SEGMENTS ごとに DirectionVector があります。
c) したがって、LINE SEGMENT(x0,y0) の BEGINNING は、前の行の END ポイントになります (たとえば、長方形のような閉じた形状を形成するため)。
SO、私の質問は、コンテキスト(つまり、ポリゴンのタイプを決定する)を考えると、2つの方向ベクトル(xとyの2つの浮動小数点値として利用可能)間の角度変化をどのように見つけるのですか???
私は非常に多くの異なるトリックを見てきました。方程式と私はこれについて明確にしようとしています.
どうもありがとうございました!
python - パターン認識
IQ が 70 の私は、これを行う方法を理解できるほど賢くありません。しかし!私が欲しいのは... Python が MySQL からテーブルを読み込んで列のパターンを見つけられるようにすることです! 同様に、列 Y が約 '1.56' で、列 Z が約 '756' の場合、列 X は通常値 'foo'です。これを行うことができますか?または、情報や本などを参照してください。天才のための本ではありません!
そして、Pythonはこれに適していますか? これには、約 600,000 行、約 20 列が含まれます...そして、今日の標準的なゲーム用コンピューター上にあります.....
accelerometer - 加速度計の信号セグメンテーション
1D加速度計信号があります(1軸のみ)。信号のいくつかの形状を認識できる堅牢なアルゴリズムを作成したいと思います。
最初に、移動平均フィルターを生の信号に適用します。添付の画像では、生の信号は赤で、平均化された信号は黒です。写真からわかるように、平均化された(黒の)信号からいくつかの傾向がわかります。信号には、加速度が最大に上昇してから下降する、ピークのようなパターンの10回の繰り返しが含まれています。これらのパターンの始まりと終わりを十字でマークしました。
だから私の目標は、マークされた位置を自動的に見つけることです。パターン抽出を困難にする問題は次のとおりです。
- パターンの開始は、パターンの終了とは異なるy値を持つ可能性があります
- パターンには複数のピークがある可能性があります
- 具体的な時間情報がありません(パターンの開始から終了まで、A時間単位かかります)
私はさまざまなアプローチを試しましたが、それはほとんど自作であるため、それらについては言及しません。私の考え方に偏ってほしくないのです。そのようなパターン抽出を行うための標準的なアプローチや本によるアプローチはありますか?それとも、誰かが問題にしっかりと取り組む方法を知っていますか?
任意のアイデアをいただければ幸いです。
algorithm - 三角形分割メッシュからの 3 次元形状検出
3D 三角測量メッシュで単純な 3D 形状 (球、円柱、円錐など) の全体または一部を検出できるアルゴリズムまたはソース コードを探しています。
点群の形状を見つけることができるアルゴリズムに関するいくつかの論文を見つけました (たとえば、この PDFを参照してください)。三角形分割は点群に簡単に変換できますが、三角形分割が既にある場合は、一致するサーフェスに関する情報が多いため、形状を見つけるのが簡単になるように思えます。たとえば、接続性が失われます。ポイントクラウドへの変換。
任意のポインタをいただければ幸いです。
image-processing - 画像内の特定の文字のすべての出現を見つける良い方法は何ですか?
同様に、スケールに関係なく、.png 内のすべての A の位置を見つけますが、すべて適切に回転しますか?
編集:これは私が考えているよりも難しい問題だと言った人は正しいです。詳細を追加したかったのです。(白地に黒のスキャンされた手書きの画像) から文字の位置を見つける方法を探しています。 .
これは大規模なプロジェクトであることを認識しているので、このようなことを行うオープンソース ライブラリや単純なアルゴリズムがあるかどうか疑問に思っていました。いくつかのコーナー マッチング スキームを試しましたが、うまくいきませんでした。
python - Birdsongオーディオ分析-2つのクリップがどれだけ一致しているかを見つける
同じ種の鳥の48000のサンプルレートで約100のwavオーディオファイルがあり、それらの間の類似性を測定したいと思います。私はwaveファイルから始めていますが、画像の操作については(ごくわずかに)知っているので、分析はスペクトログラム画像で行われると思います。私は異なる日のいくつかの鳥のいくつかのサンプルを持っています。
データの例をいくつか示します(ラベルのない軸についてはお詫びします。xはサンプル、yは線形周波数に10,000 Hzのようなものを掛けたものです): これらの鳥のさえずりは明らかに「単語」で発生します。これを比較する必要があります。類似した単語の違いと、さまざまな単語の頻度と順序の両方。
蝉の鳴き声を取り除こうと思っています。蝉の鳴き声はかなり一定の周波数で、位相が一致する傾向があるので、それほど難しくはありません。
いくつかのしきい値処理が役立つようです。
Pandora Music Genome Projectのように、既存の文献のほとんどは、曲の特性に基づいた手動分類を使用していると言われています。私はエコーネストのようになりたいです; 自動分類を使用します。更新:多くの人がこれを研究しています。
私の質問は、この分析にどのツールを使用すべきかということです。する必要がある:
- 一般的なノイズをフィルタリング/しきい値設定し、音楽を維持します
- セミのような特定のノイズを除去します
- 鳥のさえずりのフレーズ、音節、および/またはメモを分割して分類します
- パーツ間の相違/類似性の測定値を作成します。鳥の間の違いを拾い上げ、同じ鳥の異なる呼び出しの間の違いを最小限に抑える何か
私が選んだ武器はnumpy/scipyですが、openCVのようなものがここで役立つかもしれませんか?
編集:いくつかの調査とスティーブの有益な回答の後に、私の用語を更新し、アプローチを言い換えました。
neural-network - パターン認識のトレーニング(ニューラルネットワーク)
パターン認識のためにニューラルネットワークをどのようにトレーニングしますか?たとえば、画像の顔認識では、出力ニューロンをどのように定義しますか?(たとえば、カメラに顔があると言うだけでなく、顔がどこにあるかを正確に検出する方法)。また、複数の顔や異なるサイズの顔を検出するのはどうですか?
誰かが私にポインターを与えることができればそれは本当に素晴らしいでしょう
乾杯!
opencv - 手書き認識に関するいくつかの質問
こんにちは私は機械学習を勉強しています。Pythonとopencvを使用して簡単な手書き認識ソフトウェアを作成したいと思います。
簡単にするために、同じサイズの大文字の単語のみを認識します。文字を認識する良い方法は、ガウス混合モデルのパラメーターを学習するために期待値最大化アルゴリズムを使用し、トレーニングセットを使用して、新しい文字のガウス混合をトレーニング済みのものと比較することだと思います。しかし、混合物に含まれるガウス関数の数を選択する方法がわかりません。
2番目の問題は、ページに含まれる単語の数と、単語に含まれる文字の数をどのように理解するかです。em-algorithmまたは同様のもの(たとえばk-means)が解決策になるとは思いませんが、確かにいくつかのセグメンテーションの問題があります
いくつかのアドバイス?
neural-network - 複数パターン認識のためのニューラル ネットワーク出力層
画像のパターン検出を正しく行う方法またはその他のニューラル ネットワークがあるとします。画像に複数のパターンがあるニューラル ネットワークをどのように設計すればよいですか?
画像に X パターンが検出されるとします。最善のアプローチは何でしょうか? 私の知る限り、出力層のニューロンの値は [-1,1] である必要があります。X 個のパターンが認識されているかどうかは、どうすればわかりますか? これは、認識できるパターンの数にハードコードされた制限を設定する必要があるということですか (出力ニューロンの数が固定されているため)。
javascript - パターンの再利用をチェックするためのJavaScriptの正規表現の使用(たとえば、文字列で2回宣言された同じ文字シーケンス)
これらのテキスト文字列に「GARNSEY」という単語が2回宣言されていることに注目してください。
これで、D GARNSEY(ミドルネームのイニシャルなし)またはDB GARNSEY(ミドルネームのイニシャルを含む)になりますが、GARNEYが言及されているかどうかを知る必要があります。これは、姓が最初と最後の2回言及されていることを意味します。
本JavaScriptプログラマーズリファレンスによると:
「パターン全体でその正確な記号の検索を繰り返すことができます...これは\1を使用して実行できます。\1を使用すると、最初のグループ化された式の結果が参照されます。」
では、最初のグループ\ w {1、})\ 1の結果を「保存」してから、最後にそれを再利用して、ミドルネームがあるかどうかも確認します。
それでも、JavaScriptインタープリターは、以下の簡単なテストで「失敗」を警告します。
\ 1の目的を誤解していますか?上記のように、正規表現を使用して実行しようとしていることを実行するための解決策はありますか?返信ありがとうございます。