発音しにくい英単語のコレクションを作ろうとしています。
単語の発音がどれほど難しいかを示すために使用できる、ある種のアルゴリズムまたは理論があるかどうか疑問に思っていました。
これは計算できるものとしてあなたには見えますか?
これは非常に主観的なことのように思われるので、もっと客観的なものにしましょう。テキスト読み上げ技術で発音するのが最も難しい単語を挙げてみましょう。
発音しにくい英単語のコレクションを作ろうとしています。
単語の発音がどれほど難しいかを示すために使用できる、ある種のアルゴリズムまたは理論があるかどうか疑問に思っていました。
これは計算できるものとしてあなたには見えますか?
これは非常に主観的なことのように思われるので、もっと客観的なものにしましょう。テキスト読み上げ技術で発音するのが最も難しい単語を挙げてみましょう。
1つのアプローチは、各単語の2つのバージョンでリストを作成することです。1つは正しいスペルで、もう1つは最も単純な音素的スペルを使用してスペルされた単語です。2つの単語に距離関数を適用します(Levenshtein distance http://en.wikipedia.org/wiki/Levenshtein_distanceなど)。2つの単語間の距離が大きいほど、単語の発音が難しくなります。
大きな問題です!私の頭のてっぺんから、音素的アルファベットからのすべての文字を含み、難易度に基づいてすべての組み合わせの間に接続された重みを持つシステムを作成できます(非常に具体的であるため、複数の人がテストして平均を取る必要がある場合があります)、すべてのリストがありますディスクに保存されている英語の辞書からの単語を呼び出し、各エントリを循環して、音素的スペルについてwikipediaでWebスクレイピングを実行し、難易度をランク付けするスクリプトを呼び出します。これは、単語の長さだけでなく、音声学に参加する間の難易度を考慮に入れて、難易度に基づいてリストを並べ替えることができます。
それが私がやろうとしていることです:P
ある程度まで...
たとえば、音声プログラムは音声学のシステムを使用して、単語を試して発音します。
たとえば、「把握」は次のように分割されます。
把握
ただし、外国語 (またはこのパターンに従わない単語) については、例外リストを保持する必要があります。例: Yacht
提案
幸いなことに、プロセスとしての発音は、次の 2 つの要因に依存しています。
/a/,/ae/,/e/,/i/,/o/,/u/,/w/,/j/...
1つ目は、口蓋帆、頬の舌を変更して、個々の電話、つまり鼻などに関連するさまざまな音を生成する必要があるため、電話の音生成のメカニズムに関連しています。音声学に関する書籍を参照して、各音声の発音位置を見つけてください。
アルゴリズム
a weighted spanning tree with weight being the difficulty of pronouncing two consecutive phones i.e l and r or /sh/ and /s/
幸運を。