0

Python を使用して話者認識 (音声ではなく話者) システムを作成しようとしています。mfccトレーニング オーディオ ファイルとテスト オーディオ ファイルの両方の特徴を抽出しgmm、それぞれのモデルを作成しました。モデルを比較して類似性のスコアを計算する方法がわかりません。これに基づいて、システムをプログラムしてテスト オーディオを検証できます。私はこれを成し遂げるために4日間苦労しています。誰かが助けてくれれば幸いです。

4

1 に答える 1