3

次のような投稿をたくさん読みました。

そして調べてみると、ダブル メタフォン コードが見つかりました。

しかし、二重メタフォン アルゴリズムは、文字列が 1 つの単語であると仮定して、指定された文字列のタプルを返します。同じ名前の複数の単語で機能する音声アルゴリズムを知っている人はいますか? そうでない場合は、この列の各単語の単語数をカウントするスクリプトを作成し、データセットで最も頻繁に発生するセル内の単語に対して double metaphone を実行するのが最善の方法ですか?

4

1 に答える 1

3

実際、metaphone や double metaphone が「辞書の単語」ではなく固有名詞のみで機能するように設計されているというのは事実ではありません。metaphone、double metaphone、および metaphone 3 はすべて、名前と単語の両方で機能するように設計されており、両方を含むデータベースに対して開発されました。

于 2012-10-03T07:24:16.563 に答える