問題タブ [fuzzy-search]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
2281 参照

c# - NHibernateを使用した連結フルネームのあいまい検索

次のSQLをNHibernateに変換しようとしています。

私はこのようなことをしようとしていましたが、機能していません:

私が基本的にやろうとしているのは、「bob smith」の値の例を使用してテキストボックスで顧客の名前を検索し、上記のSQLのLIKE式を使用してデータベースを検索できるようにすることです。

FirstName列とLastName列を間違って検索する場合は、別の方法を教えてください。ただし、上記のSQLクエリで必要なものが得られます。

2つのソリューションで更新:

だから私は今、この問題に対する2つの解決策を見つけました。1つは、CriteriaAPIを使用することです。次の投稿には、うまく機能する答えがあります:https ://stackoverflow.com/a/2937100/670028

私が見つけたもう1つの解決策は、LINQプロジェクションと匿名型の使用を提案してくれた親切な同僚の1人に感謝します。LINQを使用したソリューションは次のとおりです。

0 投票する
4 に答える
5614 参照

python - Python での Whoosh によるファジー文字列検索

MongoDB で銀行の大規模なデータベースを構築しました。この情報を簡単に取得して、whoosh でインデックスを作成できます。たとえば、銀行名「Eagle Bank & Trust Co of Missouri」と「Eagle Bank and Trust Company of Missouri」を一致させたいと考えています。次のコードは単純なファジーで動作しますが、上記の一致を達成できません:

私に与えます:

Whooshで私が望むことを達成することは可能ですか? そうでない場合、他のpythonベースのソリューションはありますか?

0 投票する
1 に答える
1005 参照

search - あいまい検索 + 逆索引付け

あいまい検索と、逆索引付けを使用してデータベースから情報を取得する方法を研究しています。私は逆索引付けを研究しましたが、EXACT 一致でのみ機能すると思います。East Lamar Streetデータベースに文字列がある状況を想像してみてください。誰かが探していてEast Lmar Street、私は何を見つけるべきかEast Lamar Street.

Edit Distance を使用しますか?

アルゴリズムはどのように動作しますか?

データベースは逆索引付けを使用しますか?

または、フルスキャンを実行しますか?

O(1)で操作を行うためにハッシュを使用していることがわかりました。

0 投票する
3 に答える
1941 参照

mysql - 最も近い時間値の不正確な検索

タイムスタンプに基づいて値を検索するための、プログラム的および構文的に効率的な方法を探しています。基本的に、最も近いタイムスタンプの一致を見つけたいです...

たとえば、私が持っているMySQLテーブルで次のように言います。

そして、4:04:40の時間に基づいてこのテーブルをクエリしたいと思います。レコードID#3を返したい... 4:04:35を検索した場合、ID#2を返したい...これを実装するにはどうすればよいですか?このテーブルには何百万もの行があり、レーベンシュタイン距離のようなものは遅すぎると思っていました。

乾杯!

0 投票する
2 に答える
5841 参照

php - PHPで配列をあいまい検索する

検索した後、文字列のあいまい検索を行う方法を見つけました

しかし、私は文字列の配列を持っています

$search = {"a" => "laptop","b" => "screen" ....}

DB MySQL から取得したもの

単語の配列に対してあいまい検索を行う PHP クラスまたは関数はありますか?

または少なくとも、おそらくいくつかの有用な情報へのリンク

PostgreSQLの使用を推奨するコメントを見ました

あいまい検索機能ですが、

同社はすでにMySQL DBを持っていました

おすすめありますか??

0 投票する
2 に答える
1834 参照

hibernate - Fuzzy Indexes in Hibernate Search

I understand fuzzy searches all and well, but in my application they are very slow with lots of terms (~500ms). I ran across a solution to slow fuzzy searches where it was suggested that instead of doing fuzzy searches, index the terms with the levenstein algorithm, so that a regular keyword search would yield fuzzy results.

Is there any way of doing this with Hibernate Search, preferably using annotations?

0 投票する
1 に答える
129 参照

ruby-on-rails - act_as_fuzzy_searchプラグインのインストール

あいまい検索用のプラグインをインストールしたい。私はたくさん検索して出くわしました:

https://github.com/iulianu/rails-fuzzy-search

私のモデルでは:

しかし、次のエラーが発生します。

誰かがこれを修正する方法を知っていますか?

0 投票する
1 に答える
2276 参照

javascript - より良いjavascriptテキストマッチングスコアリングシステムを探しています

私は多くのプロジェクトで文字列スコアを使用しています。名前や国などのリストを並べ替えるのに最適です。

現在、私は、いくつかの単語だけでなく、より大きなテキストのセットに対して用語を一致させたいプロジェクトに取り組んでいます。段落のように。

次の2つの文字列が与えられます。

用語をより高くeat戻したいのですが。ただし、スコアは高くなります。string2string1string1

たぶん私はstring2もっと高いスコアを付けるべきだと考えるのは間違っています、そしてそれがあなたの論理であるならば、私はその論理についての議論を聞きたいです。それ以外の場合、よりコンテキストに応じたjavascriptマッチングアルゴリズムに関するアイデアはありますか?

0 投票する
1 に答える
1005 参照

nlp - ファジーセンテンス検索アルゴリズム

平均的な長さのフレーズのセット(約10000)があり、その中で特定のフレーズを検索したいとします。私が探しているフレーズには、いくつかのエラーが含まれている可能性があります。たとえば、1つまたは2つの単語を見逃したり、単語を置き忘れたり、ランダムな単語を使用したりします。たとえば、データベースに「赤いバイクに乗っているときにクリスティンを見ました」と表示されます。 「青いバイクに乗っているときにクリスティンを見た」、または「バイクに乗っているときにクリスティンとマリオンを見た」など、多くのことを望んでいます。この問題へのいくつかの良いアプローチは何でしょうか?私はレベンスタインの距離について知っています、そして私はまたこの問題が簡単で良い解決策を持っていないかもしれないと思います。

0 投票する
1 に答える
10452 参照

elasticsearch - elasticsearch ファジー マッチング max_expansions & min_similarity

私のプロジェクトでは、主にスペルミスや同じ名前の異なるスペルを見つけるためにあいまい一致を使用しています。エラスティック検索のあいまい一致がどのように機能し、タイトルに記載されている 2 つのパラメーターがどのように使用されるかを正確に理解する必要があります。

私が理解しているように、min_similarityは、クエリされた文字列がデータベース内の文字列と一致する割合です。この値がどのように計算されるかについての正確な説明が見つかりませんでした。

私が理解しているmax_expansionsは、検索を実行するレーベンシュタイン距離です。これが実際にレーベンシュタイン距離である場合、それは私にとって理想的な解決策でした. とにかく、それは機能していません。たとえば、「Samvel」という単語があります

ドキュメントには、私が実際に理解していないことが書かれています:

ですから、これらのパラメータが検索結果にどのように影響するかを正確に説明してください。