問題タブ [pattern-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Java 文字列パターン認識
L、T、および A で構成される約 1,000 文字の文字列があります。そこには単純なパターンがあると確信しており、それを見つけるための迅速かつ簡単な方法があるかどうか疑問に思っています. この文字列は、これが 1 回限りではないように変更されます。
私が探しているパターンは、たとえば文字列が
部分文字列LLLLLAATAALLは、この文字列で 4 回繰り返されます。このような部分文字列を検索したいのですが、それらがどこで始まり、どこで終わり、いくつあるのか、そしてそれらが主な文字列にどれくらいの長さであるかがわかりません。
この種のものを探すためのJavaのツールがあれば、アドバイスをいただければ幸いです。
nt
machine-learning - 初心者:将来の成功を予測するために問題を与えられた場所から始めるかどうか
ユーザーが商品の将来の価値(または需要)について予測できる本番Webベースの製品があります。履歴データには、約10万の例が含まれ、各例には約5つのパラメーターがあります。
予測と呼ばれるデータのクラスを考えてみましょう。
予測の結果を測定するペアの結果クラス:
成功のためのテストケースを定義できます。予測時に方向と値を検討するときに、将来の値のチェックポイントのいずれか2つが適切である場合。
ユーザーがフォームを送信した瞬間に予測クラスのすべてが認識され、predictionResultの情報は後で確認されます。理想的には、モデルまたはアルゴリズムは、アルゴリズムが新しい予測に適用されるという3年間の履歴から導き出すことができ、成功するかどうかについての確率を得ることができます(ブールY/Nフラグで満足しますこれが面白いかどうか)。
私は機械学習についてあまりよく知らないので、資料を読み進めようとしています。しかし、このような問題を解決するために必要なことを正確に調査して実践できるように、いくつかのガイダンスがあれば素晴らしいと思います。
ありがとうございました
java - Javaでの一連のポイントの単純な形状認識
座標系にランダムに分布した点のセットがあり、いくつかの点が正方形、円、平行四辺形、単純な線などの幾何学的図形を形成しているかどうかを認識したいと思っています。
パターンを認識するためのライブラリまたはアルゴリズムはありますか?それとも、そのようなものをプログラムする方法のヒントはありますか?
algorithm - 特定のオブジェクト/画像認識タスクに最適なアプローチは?
写真で特定のオブジェクトを検索しています。
オブジェクト:中央にXが付いた長方形の輪郭。長方形のチェックボックスのように見えます。それで全部です。したがって、塗りつぶしはなく、行だけです。長方形の長さと幅の比率は同じですが、写真の任意のサイズまたは任意の回転にすることができます。
私はたくさんの画像認識アプローチを見てきました。しかし、私はこの特定のタスクに最適なものを決定しようとしています。最も重要なのは、オブジェクトが線で構成されており、塗りつぶされた形状ではないことです。また、遠近法による歪みがないため、写真では長方形のオブジェクトは常に直角になります。
何か案は?かなり簡単に実装できるものを期待しています。
皆さんありがとう。
c++ - パターン認識/画像処理用の C または C++?
パターン認識のコースを受講しようとしています。私は C も C++ も予備知識がないので、コースの前にどちらかを少しだけ学び、コースを受講するときにもっと学ぶようにと教授に言われました。
どちらを選ぶべきですか?
私が持っているプログラミングの予備知識は、ほとんどが C# に限定されていますが、一部の PHP、SQL、および Prolog も同様です。
search - 視覚的類似性アルゴリズム (CBIR 用)
サイズ、角度、色、コンテンツベースの画像検索の回転不変である、画像間の視覚的類似性のコレクションを構築しようとしています。しかし、他の人が利用できる場合は、pls. 離れて提案します。
私は OpenCV の Match テンプレートと Match シェイプに精通しています。AForge.NET も調べました。
ps http://www.imgseek.net/homeのようなものが理想的です。
path - 後で目的を分析するためにパスの組み合わせを検出して保存するための最良の方法
ユーザーからのパスパターンを保存する方法についてのアイデア/例を探しています。ユーザーの行動を分析し、何らかの方法で検出できる場合は「最も使用されるパス」を最適化することを目的としています。
例えば。彼らは何の後にどのアクションを実行するので、後で特定のアクションが繰り返し実行されるかどうかを確認できます。したがって、ショートカットを開発するか、一部のアクションを組み合わせたマルチアクションにアセンブルします。
私の最初の推測は、ある種の「単純なログ」であり、おそらくSQL方式で格納されており、各アクションをインデックスとして保持し、すべてを記録することができます。
問題は、ログを記録している間でもパス/アクションが動的に変更される可能性があることです。そのため、後でパターンを探すときにも、この事実に対処できる必要があります。
最初にすべての「ビッグタイム」をログに記録し、しばらくしてからすべての詳細をPOST処理しますか、それとも他の戦術で素晴らしい経験がありますか?
私が心配しているのは、これが1か月以上、毎日1000人のユーザーを記録している間、かなりの時間を費やすことになるということです。
これが理にかなっていることを願っています。誰かがサンプルコード、擬似コード、またはおそらく有用なものへのリンクを提供できるかどうかを知りたいと思います。
私たちのツールは、C#、SQLデータベース、XML、および.NET3.5です。クライアントは必要に応じて.NET4.0を入手することもできます。
期待どおりのパターン例
など。彼らが次に何をするか、何人使用するか、どれくらいの頻度でそれを行うかを知る実際の方法はありません。
二次的な目標は、可能であれば、後でGと呼ばれる新しい「アクション」を追加する場合(説明のためのサンプルです。何百ものアクションがあります)、これらの新しい動作が以前のパターンに与える影響をどのように検出できますか。
それをよりよく説明するために、ここでの私の考えは、「パターン内のパターン」を検出する方法であり、圧縮がどのように機能するかのように、「反復パターン」が斑点状になります。これらのパターンがどれくらいの長さであるか、またどれくらいの頻度で発生するかはわかりません。これを「小さな断片」にどのように分解しますか?あなたが考える最善のアプローチは何ですか?
nlp - テキストとオーディオの同期。これを行うためのNLP/音声認識ライブラリはありますか?
音声録音を既知のテキストと同期させたいのですが。これを容易にする音声テキスト/自然言語処理ライブラリはありますか?単語の境界を検出し、辞書から候補の一致を計算したいと思います。私がSOで見つけた質問のほとんどは、書き言葉に関するものです。
必要ですが、必須ではありません:
- オープンソース
- すぐに使えるアメリカ英語と互換性があります
- クロスプラットフォーム
- 完全に文書化
編集:これは非常に広範で、素朴な質問であることに気づきました。ご指導いただきありがとうございます。
私がこれまでに見つけたもの:
- OpenEars(iOS Sphinx / Fliteラッパー)
fonts - スクリーンショットの文字を認識する最良の方法は?
スクリーンショットからすべての文字を認識するために何をお勧めしますか? スクリーンショットは完全にクリア (白い背景に黒いテキストのみ) で、テキストには標準フォント (Windows にインストール済み) を選択できます。私はいくつかの OCR の方法 (Tesseract など) を試しましたが、一部の文字の認識に誤りがありました (テキストにノイズがほとんどなく、フォントが最も一般的なものであったため、困惑しました。Courier New、Fixedsys など)。 100% 正確である必要があります。この特定の目的、パターン認識などに使用できるライブラリはありますか? または、等幅フォントでスクリーンショットを取得する必要があります。右の +font_size ピクセルに移動する画像を反復処理し、キャプチャしたものを同じサイズの同じフォントの文字と数字のメモリ内表現と比較しますか? この問題に対する最善のアプローチは何でしょうか? 事前にどうもありがとうございました。
更新: スクリーンショットを作成している正確なサイズの等幅フォント (Courier New) を使用して Tesseract をトレーニングすることにより、最終的に 100% の精度を得ることができました。将来誰かを助けることを願っています:)
image-processing - LineのDirectionVectorを決定する方法は?
幾何学的形状認識 (長方形、楕円形など) のコンテキストでプログラミングの問題があります。このコンテキストでは、たとえば (x1,y1) から (x2,y2) までの単純な線があるとします - 一連の点 (xy ペア) で構成されます -
この線の DIRECTION VECTOR はどのように計算しますか? その背後にある数学は理解していますが、クライアントから提供されたアルゴリズムは少し曖昧です。このアルゴリズムのステップ 3) で行き詰まっています。以下は、クライアントから提供されたものとまったく同じアルゴリズムです(疑似コードではなく英語で)。
1)「ストローク」または「ライン」を構成するポイントを X のセットにブレーキします(デフォルトでは X= 20 - 調整します) ポイント = PointSet
2) 各 PointSet について、最初と最後の Y ポイント (デフォルトでは Y= X/5) の EndPouint (両端のポイントの平均) を見つけます。
3) PointSet の DirectionVector を見つける = CentrePoints を減算する
4) PointSet の各ペアについて、AngleChange = PointSet の DirectionVectors 間の角度を見つけます。
など.......私はポイント(3)が何を意味するのかを理解しようとしています....どんな助けも大歓迎です!前もって感謝します。