4

次のように、100,000以上の単語を音素( CMUdict )にマッピングしています。

ABANDONED => [ 'AH', 'B', 'AE', 'N', 'D', 'AH', 'N', 'D' ]

元の単語の文字を音素の数に等しい数のグループに分割したい、例

ABANDONED => [ 'A', 'B', 'A', 'N', 'D', 'O', 'N', 'ED' ]

音素から書記素へのマッピングはありませんが、音素から書記素への統計モデルを計算し、それを使用して各単語をどこで分割するかを決定できるはずです。(このモデルを使用して、新しい単語を可能性のある音素に変換することもできればよいのですが)

これどうやってするの?隠れマルコフモデルが適用できるように聞こえると思っていましたが、それ以上のことはわかりません。

4

1 に答える 1

1

N統計を収集するには、まず、同一の文字と音素 (と など)を照合して、単語をその音声表現に合わせNます。動的計画法でベストマッチを得ることができます。次に、単語の残りの文字を残りの音素にマッピングできます。

頻度を計算したら、ノイズ チャネル モデルを使用して新しい単語を音素に変換できます。

于 2013-01-28T08:37:23.927 に答える