次のような投稿をたくさん読みました。
そして調べてみると、ダブル メタフォン コードが見つかりました。
しかし、二重メタフォン アルゴリズムは、文字列が 1 つの単語であると仮定して、指定された文字列のタプルを返します。同じ名前の複数の単語で機能する音声アルゴリズムを知っている人はいますか? そうでない場合は、この列の各単語の単語数をカウントするスクリプトを作成し、データセットで最も頻繁に発生するセル内の単語に対して double metaphone を実行するのが最善の方法ですか?
次のような投稿をたくさん読みました。
そして調べてみると、ダブル メタフォン コードが見つかりました。
しかし、二重メタフォン アルゴリズムは、文字列が 1 つの単語であると仮定して、指定された文字列のタプルを返します。同じ名前の複数の単語で機能する音声アルゴリズムを知っている人はいますか? そうでない場合は、この列の各単語の単語数をカウントするスクリプトを作成し、データセットで最も頻繁に発生するセル内の単語に対して double metaphone を実行するのが最善の方法ですか?