私は、英語での「音のような」文字列マッチングのためのSoundexおよびDouble-Methaphoneアルゴリズムについて知っています。同様のアルゴリズム、またはオランダ語のアルゴリズムの1つの移植版はどこにありますか?
1172 次
私は、英語での「音のような」文字列マッチングのためのSoundexおよびDouble-Methaphoneアルゴリズムについて知っています。同様のアルゴリズム、またはオランダ語のアルゴリズムの1つの移植版はどこにありますか?
あなたがアルゴリズムを追いかけているだけなら、私はnltkをチェックします。データを提供すると、EdwardLoperとStevenBirdによるFST(Finite State Transducers)の寄稿でいくつかをテストできる可能性があります。または、nltkと一緒に配布されている「AlpinoDutchTreebank」のデータを使用することもできます。