nlp - 100,000 の単語から音素へのマッピングが与えられた場合、元の単語を音素の境界で分割するにはどうすればよいでしょうか?

Question

次のように、100,000以上の単語を音素( CMUdict )にマッピングしています。

ABANDONED => [ 'AH', 'B', 'AE', 'N', 'D', 'AH', 'N', 'D' ]

元の単語の文字を音素の数に等しい数のグループに分割したい、例

ABANDONED => [ 'A', 'B', 'A', 'N', 'D', 'O', 'N', 'ED' ]

音素から書記素へのマッピングはありませんが、音素から書記素への統計モデルを計算し、それを使用して各単語をどこで分割するかを決定できるはずです。(このモデルを使用して、新しい単語を可能性のある音素に変換することもできればよいのですが)

これどうやってするの？隠れマルコフモデルが適用できるように聞こえると思っていましたが、それ以上のことはわかりません。

score 1 · Accepted Answer

N統計を収集するには、まず、同一の文字と音素 (となど)を照合して、単語をその音声表現に合わせNます。動的計画法でベストマッチを得ることができます。次に、単語の残りの文字を残りの音素にマッピングできます。

頻度を計算したら、ノイズチャネルモデルを使用して新しい単語を音素に変換できます。

1 に答える 1