問題タブ [soundex]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
14377 参照

fuzzy-search - レーベンシュタイン距離ベースの方法とSoundex

関連スレッドのこのコメントに従って、レーベンシュタイン距離ベースの方法がSoundexよりも優れている理由を知りたい.

0 投票する
1 に答える
1420 参照

soundex - 国際Soundexの作り方は?

たとえば、Soundex アルゴリズムは英語用に最適化されています。大規模な言語ファミリーに適用される、より普遍的なアルゴリズムはありますか?

0 投票する
2 に答える
1021 参照

linq-to-sql - LinqToSql で Soundex (または他の SQL 関数) を使用することは可能ですか?

LinqToSql (トレーニングで使用するため) を使用するために、現在ストアド プロシージャに実装されているコードをリファクタリングしています。linqToSql クエリで SQL 関数を使用することは可能ですか?

0 投票する
2 に答える
1267 参照

metaphone - ダブルメタフォンエラー

私はLawrence Philips Double-Metaphoneアルゴリズムを使用して大きな成功を収めていますが、いくつかの組み合わせで奇妙な「予期しない結果」を見つけました。

他の誰かが共有しても構わない他の部分のアルゴリズムに追加または変更を加えているか、または期待どおりに機能しないことがわかった組み合わせだけを持っていますか。

例えば。次の間に問題がありました:

  • ピーシルとブッシュリー。(どちらもPXLと一致)
  • ロックリフとロッククリフ (RKLF と RKKL)
0 投票する
6 に答える
2091 参照

java - soundexアルゴリズムのデータ構造?

soundexアルゴリズムプログラムに使用するデータ構造について、誰かが私に提案できますか? 使用言語はJavaです。誰かがJavaでこれに取り組んだことがあるなら。プログラムには次の機能が必要です。

プログラムの実装に、使用するデータ構造に関するいくつかのアドバイスだけは望んでいません。

0 投票する
4 に答える
3708 参照

sql-server - 非ラテン文字セットでの SQL Server の SoundEx 関数?

SQL Server (2000) のSoundex 関数はアジア文字セットで動作しますか? クエリで使用しましたが、正しく機能していないように見えますが、中国語の読み方がわからないことが原因である可能性があることに気付きました...

さらに、関数がうまく動作しない可能性のある他の言語はありますか? (ロシア語など)

ありがとう、
フランク

0 投票する
2 に答える
1217 参照

soundex - php SOUNDEXが3桁しか出力しない場合にphpでSOUNDEXを確認する方法

SOUNDEX を使用して会社名を比較しようとしていますが、soundex の php 呼び出しは 3 桁しか出力しないため、比較は正確ではありません。結果がより正確になるように、より良いsoundex出力を取得する方法はありますか?

0 投票する
4 に答える
4876 参照

c++ - C++ を使用した Soundex アルゴリズムの実装

簡単に言えば、Soundex Algorithm は一連の文字をコードに変更します。同じ Soundex コードを生成する文字は、同じように聞こえると言われます。

  • コードは 4 文字幅です
  • コードの最初の文字は常に単語の最初の文字です

アルファベットの各文字は、特定のグループに属しています (少なくともこの例とその後のコードでは、これが私が固執するルールです):

  • b、p、v、f = 1
  • c、g、j、k、q、s、x、z = 2
  • d、t = 3
  • l = 4
  • メートル、n = 5
  • r = 6
  • アルファベットの 1 文字おきにグループ 0 に属します。

その他の注目すべきルールは次のとおりです。

  • グループ 0 に属するすべての文字は、指定された単語の文字が不足しない限り無視されます。この場合、残りのコードは 0 で埋められます。
  • 同じ数字を 2 回以上連続して使用することはできないため、文字は無視されます。唯一の例外は、複数の 0 を持つ上記のルールです。

たとえば、"Ray" という単語は、次の Soundex コードを生成します: R000 (R は提供された単語の最初の文字です。a はグループ 0 の一部であるため無視されます。y はグループ 0 の一部であるため無視されます。コード内の残りの 3 文字は 0 です)。

1) Soundex コードの作成に使用される 128 文字の配列と、2) 関数の完了時に Soundex コードを格納するために使用される空の 5 文字の配列 (およびほとんどの配列が私のプログラムで使用するために行うように、参照によって返されます)。

ただし、私の問題は変換プロセスにあります。上記で提供したロジックは、私のコードでは正確に機能していません。そして私はなぜだか分からない。

strlen の使いすぎが原因かどうかはわかりませんが、何らかの理由でプログラムが最初の while ループ内で実行されている間、文字が実際にコードに変換されません (つまり、if ステートメントが実際に実行されません)。

それで、私は何を間違っていますか?どんな助けでも大歓迎です。

0 投票する
3 に答える
3360 参照

sql-server - SQL Server 2005 の全文検索を使用した「そのように聞こえます」、「もしかして」機能

CONTAINSTABLE キーワードを使用して、SQL Server 2005 データベースに全文検索を実装しました。元のクエリで結果が得られない場合、「そのような音」またはGoogleの「もしかして」機能を追加する方法があるのだろうかと思っていました。

0 投票する
2 に答える
9360 参照

algorithm - 英語以外の文字の soundex/metaphone を有効にする

ここ数日、soundex、metaphone、およびその他の文字列検索手法を研究してきました。私の理解では、英語以外の単語を英語に音訳した場合、両方のアルゴリズムがうまく機能します。

ただし、そのような検索が、ドイツ語、ノルウェー語、さらにはキリル文字などのアルファベットに対応する、文字変換されていない元の言語で機能する必要があります。

これらのアルファベットを完全に処理できる検索アルゴリズムはありますか? それとも、Lucene などのサードパーティの全文検索ライブラリを使用したほうがよいでしょうか? したがって、質問は「Lucene は英語以外のアルファベットを処理しますか?」になります。