私はLawrence Philips Double-Metaphoneアルゴリズムを使用して大きな成功を収めていますが、いくつかの組み合わせで奇妙な「予期しない結果」を見つけました。
他の誰かが共有しても構わない他の部分のアルゴリズムに追加または変更を加えているか、または期待どおりに機能しないことがわかった組み合わせだけを持っていますか。
例えば。次の間に問題がありました:
- ピーシルとブッシュリー。(どちらもPXLと一致)
- ロックリフとロッククリフ (RKLF と RKKL)
私はLawrence Philips Double-Metaphoneアルゴリズムを使用して大きな成功を収めていますが、いくつかの組み合わせで奇妙な「予期しない結果」を見つけました。
他の誰かが共有しても構わない他の部分のアルゴリズムに追加または変更を加えているか、または期待どおりに機能しないことがわかった組み合わせだけを持っていますか。
例えば。次の間に問題がありました:
すべてのSoundex、Metaphone、およびバリアントスキームは、期待したものと同じではない結果をもたらす場合があります。これは避けられません-それらは、特別な情報を保持するプロパティを備えた多かれ少なかれ単純なハッシュアルゴリズムと見なすことができ、そうでない場合は衝突を生成し、そうでない場合は違いを生成することがあります。
物事を改善するための1つの可能な方法は、「同義語リング」を使用することです。これは基本的に、スペルとは関係なく、同義語と見なされるべき単語のリストを生成します。私は名前の一致の文脈でそれらに遭遇しました。たとえば、Chaudriのバリアントには次のものが含まれます。
CHAUDARY CHAUDERI CHAUDERY ChaudharyさんCHAUDHERI CHAUDHERY CHAUDHRIチョードリーChaudhuriのCHAUDHURY CHAUDHY CHAUDREY CHAUDRI CHAUDRY CHAUDURI CHAWDHARY CHAWDHRY CHAWDHURY CHDRY CHODARY CHODHARI CHODHOURY CHODHRY CHODREY CHODRY CHODURY CHOUDARI CHOUDARY CHOUDERY CHOUDHARI ChoudharyさんCHOUDHERY CHOUDHOURY CHOUDHRI CHOUDHRY CHOUDHURIチョードリーCHOUDREY CHOUDRI CHOUDRY CHOUDURY CHOUWDHRY CHOWDARI CHOWDARY CHOWDHARY CHOWDHERY CHOWDHRI CHOWDHRY CHOWDHURI CHOWDHURRYY CHOWDHURY CHOWDORY CHOWDRAY CHOWDREY CHOWDRI CHOWDRURY CHOWDRY CHOWDURI CHOWDURY CHUDARY CHUDHRY CHUDORY COWDHURY
通常のメタフォンは、ピーズヒルとブッシュリーの違いを返しています
ピーズヒルPXLブッシュリーBXL