プログラムで単語の同音異義語を生成したい。つまり、元の言葉に似た言葉。
私はSoundexアルゴリズムに出くわしましたが、一部の文字を他の文字 (d ではなく t など) に置き換えるだけです。少なくとも同音部分文字列を提供する、もう少し洗練されたリストまたはアルゴリズムはありますか?
重要: 辞書に載っていない単語にこれを適用したいので、実際の単語全体に頼ることはできません。
編集:
入力は文字列で、多くの場合固有名詞であるため、標準 (同音異義語) 辞書にはありません。例としては、GoogleやMcDonald'sなどがあります(有名な 2 つのエンティティを挙げただけですが、多くはもっと人気がありません)。
出力は、この文字列の (ランダムな) 同音異義語です。単語には複数の同音異義語があることが多いため、1 つの (ランダムな) 同音異義語が私の目標です。Googleの場合、同音異義語はgugel、またはMcDonald'sの場合はMacDonald'sです。