問題タブ [pattern-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pattern-recognition - 方法: パターン認識
パターン認識についてもっと学びたいと思っています。私はそれがやや広い分野であることを知っているので、対処することを学びたい特定のタイプの問題をいくつか挙げます:
- ランダムに見える一連のバイトからパターンを見つける。
- 画像内の既知の形状 (円や四角など) を認識します。
- 一連の位置 (Vector3) が与えられた動きのパターンに気づく
これは私にとって個人的に新しい実験領域であり、正直なところ、どこから始めればよいかわかりません :-) 私は明らかに、銀の大皿で提供される答えを探しているわけではありませんが、いくつかの検索上記の問題領域の概念を理解するための用語および/またはオンライン リソースは素晴らしいものです。
ありがとう!
ps:追加のクレジットとして、上記のリソースがC#のコード例/ディスカッションを提供する場合は壮大になります:-)が、そうである必要はありません
text-processing - Google ブックスの人気のパッセージ機能はどのように開発されましたか?
Google が人気のパッセージ ブロック機能をどのように作成したかについて、誰かが理解しているか、知っているか、または包括的な文献やソース コードを教えてくれるかどうか知りたいです。ただし、同じことができる他のアプリケーションを知っている場合は、回答も投稿してください。
私が何について書いているのかわからない場合は、人気のあるパッセージの例へのリンクを参照してください。書籍 Modeling the legal decision process for information technology applications ... の概要を見ると、Georgios N. Yannopoulos によって次のように表示されます。
人気のパッセージ
...方向、不定。想定外のケースが発生したときに提起される問題については、予期していなかったため、解決していません。公園のある程度の平和が、これらのものを使用することに喜びや興味を持っている子供たちのために犠牲にされるか、それから守られるべきか. 想定外の事態が発生した場合、私たちは問題に直面し、競合する利益の中から最も満足できる方法を選択することで問題を解決することができます. 実行中...ページ86
これは、「機械的」法学に適した世界です。明らかに、この世界は私たちの世界ではありません。人間の立法者は、将来もたらされる可能性のある状況のすべての可能な組み合わせについて、そのような知識を持つことはできません。この予測不可能性は、目標の相対的な不確定性をもたらします。一般的な行動規則 (例えば、公園に車両を持ち込んではならないという規則) を大胆に構築するとき、この文脈で使用される言語は、すべてが満たさなければならない必要条件を修正します... 86 ページ
集中的なパターン マッチング プロセスである必要があります。n-gram モデル、テキスト コーパス、剽窃の自動検出しか思い浮かびません。しかし、n-gram はシーケンス内の次の項目を予測するための確率モデルであり、(私の知る限り) テキスト コーパスは手動で作成されます。そして、この特定の場合、人気のある文章では、大量の単語が存在する可能性があります.
私は本当に迷っています。そのような機能を作成したい場合、どのように、またはどこから始めればよいですか? また、この内容に最適なプログラミング言語を回答に含めてください: F# またはその他の関数型言語、PERL、Python、Java... (私自身が F# ファンになりつつあります)
PS: 誰かが自動剽窃検出タグを含めてくれませんか?
algorithm - 手書き認識アルゴリズム
手書き認識のための特定のアルゴリズムはありますか? アルゴリズムは手書きの手紙を認識する必要があります。
誰でも助けることができれば、事前に大歓迎です。
ありがとうございました
python - セマンティック画像認識の開始
適切な画像を(不適切に)認識する方法は?
写真と画像のモデレートと管理を対象としたgaeを容易にし、有効にし、容易にするために、基本的なPython画像認識、つまり、人間が判断できるまで疑わしい素材を抑制し、そのほとんどを承認するために画像がどのように見えるかという基本的なセマンティック情報を開始します。良いです。10,000を超える画像のテストバッチには1つまたはごくわずかしか含まれていなかったため、誤検知を自然に回避することは適切です。私は以下のリンクをたどることを見つけました、そしてすべてのアドバイス、提案と推薦のために前もってすべてに感謝します。非常に基本的に、モデレートは、デフォルトの決定に応じて、多数の画像と、デフォルトの「ok」またはその逆のボタン「ok」と「Disapprove」ボタンを表示します(デフォルトでは、おそらくすべてを公開し、絶対的なものから不適切な場合はアドホック(人間)の不承認主要部分> リンクテキスト
computer-vision - ダウンヒル シンプレックス法
テンプレート マッチングにダウンヒル シンプレックス法を使用することは可能ですか?オブジェクトのエッジに 40 個のランドマークがあり、これらのランドマークに法線ベクトルのピクセル強度があり、ダウンヒル シンプレックス法を使用してテンプレートをストレッチするとします。各反復の後の反復は、私が取り組んでいるテンプレートオブジェクトと画像にあるピクセルの誤差の平均二乗をチェックしますか?誰もがアイデアを得ましたか?ありがとう
iphone - iPhoneの画面上に描画する際のパターン認識
ユーザーが指で特定のパターンを描くことでコマンドを発行できるゲームを作成しようとしています。たとえば、円、「S」文字、有効期限などを描く場合.
私はすでにタッチイベントに精通しており、座標を読み取ることができます...私の問題は、ある程度のエラーを伴うパターンの認識に関するアルゴリズムと情報を見つけることです....たとえば、円を検出することになっているユーザーが完全なものを作成していなくても、円を検出する必要があります。
問題のリソースはありますか?, ありがとう!
image-processing - データのパターンを認識するための最善のアプローチと、そのトピックについてさらに学ぶための最良の方法は何ですか?
私が一緒に働いている開発者は、舗装の画像を分析して舗装の亀裂を見つけるプログラムを開発しています。彼のプログラムが見つけた亀裂ごとに、その特定の亀裂を構成するピクセルを示すエントリがファイルに生成されます。ただし、彼のソフトウェアには 2 つの問題があります。
1) いくつかの偽陽性を生成します
2) ひびを見つけた場合、その小さな部分だけを見つけて、それらの部分を別々のひびとして示します。
私の仕事は、このデータを読み取って分析し、偽陽性と実際の亀裂を区別するソフトウェアを作成することです。また、クラックのすべての小さなセクションを 1 つにグループ化する方法も決定する必要があります。
偽陽性を排除するためにデータをフィルタリングするさまざまな方法を試し、クラックをグループ化するためにニューラル ネットワークを使用して、ある程度の成功を収めました。エラーが発生することは理解していますが、現時点ではエラーが多すぎます。私のタスクを達成するための最善の方法、またはそれについてもっと学ぶための、AI 以外の専門家のための洞察を誰かが持っていますか? どのような本を読むべきか、どのような授業を受けるべきか?
編集私の質問は、同僚のデータのパターンに気づき、それらのパターンを実際の亀裂として識別する方法についてです。私が関心を持っているのは高レベルのロジックであり、低レベルのロジックではありません。
編集実際には、私が扱っているデータを正確に表現するには、少なくとも20枚のサンプル画像が必要です。それは大きく異なります。しかし、ここ、ここ、そしてここにサンプルがあります。これらの画像は、同僚のプロセスによって既に処理されています。赤、青、および緑のデータは、分類する必要があるものです (赤は暗い亀裂、青は軽い亀裂、緑は広い/封印された亀裂を表します)。
python - 簡単な物体認識
===解決済み===
ご提案とコメントをありがとうございます。Beginning Python Visualization book (第 9 章 - 画像処理) に記載されている flood_fill アルゴリズムに取り組むことで、私が望んでいたものを実装しました。オブジェクトを数え、各オブジェクトを囲む四角形を取得し (したがって、高さと幅)、最後にそれぞれの NumPy 配列または行列を作成できます。
最適化されたアプローチではありませんが、私が望むことはできます。私が使用するソース コード (lab2.py) と png ファイル (lab2-particles.png) は、http: //code.google.com/p/ccnworks/source/browse/#svn/trunk/AtSc450 に配置されています。 .
ヒストグラムを表示するには、NumPy と PIL がインストールされており、matplotlib が必要です。コードのコアは、主な再帰的なオブジェクト検索アクションが発生する objfind 関数内にあります。
もう1つの更新:
SciPy のndimage.label()も、私が望んでいることを正確に実行します。
NumPy および SciPy メーリングリストのDavid-Warde FarleyとZachary Pincusに乾杯、これを私の目に向けてください :)
=============
こんにちは、
粒子分光計で測定された氷の粒子の影を含む画像があります。後で分類して計算でさらに使用できるように、各オブジェクトを識別できるようにしたいと考えています。
本質的に、私がやりたいことは、各エンティティを簡単に選択できるファジー選択ツールを実装することです。
どうすればこの問題を簡単に解決できますか? (できればPythonを使用してください)
ありがとう。
注: 私の質問では、特定の接続された各ピクセルをオブジェクトまたはエンティティと呼んでいます。以下に示すように、それらを抽出して NumPy 配列表現を作成するという私の意図。(ここでは左上のオブジェクトを使用しています。ピクセルが存在する場合は 1 を使用し、存在しない場合は 0 を使用します。このオブジェクトの形状は 3 x 3 で、対応して高さ 3 ピクセル、幅 3 ピクセルです。これらは、2D ドメインへの実際の氷粒子の投影です。 、それらが球状であり、同等の半径が (高さ + 幅)/2 であるという仮定の下で、後でいくつかのスケーリング -- ピクセルから実際のサイズまで、および体積の計算が続きます)
これは、使用する画像の一部です。
スクリーンショット http://img43.imageshack.us/img43/2327/particles.png
c# - 条件付きで入力をブロックするWindowsアプリケーションをどのように作成しますか?
「zlxkkkkkkkk;」のようなナンセンスな入力をキーボードに入力している猫や他の動物がいると信じているときにキーストロークが入力されないようにするWindows専用のユーティリティであるPawSenseについて聞いたことがあるかもしれません。暇なときにやるのは楽しいプロジェクトのようですが、それを実装するための詳細について疑問に思っていました。
ハードコードされたヒューリスティックを使用するか、ある種のパターン認識アルゴリズムを使用して(以前に経験したことがあり、快適に感じる)、そのパターン認識部分を実行できると思います。私の質問は、システムプログラミングの側面と、入力をブロックする方法のロジックについてです。
猫のタイピングを検出した場合は、アプリケーションに入力を監視させ、課題を提示する必要があります。最近のキーストロークのバッファを保持し、それが猫以外のタイピングである場合にのみそれらを通過させますか?または、猫のタイピングが発生した場合、入力をブロックする前に少数だけを通過させますか?使用したい実際のロジックは何ですか?
たとえばC#での入力のブロックの実際の仕組みについては、このサイトで他に質問があります。繰り返しになりますが、私の質問は、猫のタイピングを検出してブロックするためにどのロジックを使用するかです。
string - 個人名を分割するアルゴリズム
名前の区切り方についての参考文献を探しています。「John A. Doe」のように、最初 = John、中 = A.、最後 = Doe です。メキシコでは、父方、母方、ファーストネーム、セカンドネームがあり、さまざまな順列で書くことができるため、問題は非常に複雑です。
データに依存するため、すべての単語のスコアを計算するマッチング ソフトウェアを使用して、意思決定を行うことができます (これは大きなデータベースに基づいています)。入力データはクリーンではありません。一部の政府の Web ページからインポートされたものであり、人間によってフィルター処理されているため、認識が必要なジャンクが含まれている可能性があります。助言がありますか?
[編集] 例:
先ほど言ったように、各単語の意味はスコアによって異なります。それを知る方法はありません
コアからではない場合、名前が付けられます。非常に強力なデータベース (8,000 万レコード程度) があるため、スコアリング システムをある程度利用できます。それを使用するアルゴリズムを設計していますが、他の参考文献を探しています。