8

ホーム オートメーション コマンドに Microsoft Speech C# API を使用しています

音声入力をハッシュし、誰が話しているかを認識する方法または組み込みの C# メソッドがあるかどうかを知りたいです。アリスかボブなら「Hello Alice」か「Hello Bob」。

編集:

Microsoft Speech API は、録音の .wav を提供できます。誰が話しているかを理解するために、ハッシュ、処理、...できるかもしれません。

  • 大きな声、ゆっくりとした変調、... => ボブ
  • 高い声、速い変調、... => アリス
4

4 に答える 4

2

話者認識は難しい問題であり、現在も活発な研究分野です。Microsoft の音声 API が話者認識をサポートしているとは思いませんが、100% 確実ではありません。

トピックを調査しているときに、次の記事が非常に役立つことがわかりました。これは主題を紹介し、非常に大雑把な実装も提供します。おそらく開始するのに適した場所です。

http://www.ibm.com/developerworks/opensource/library/os-sndpeek/index.html

于 2012-08-04T10:34:04.953 に答える
0

話者ダイアライゼーションの問題 (誰がいつ話すかを見つける) を解決しようとしているようです。そのためのツールキットがインターネット上に多数あります。LIUM と呼ばれるもの (Java で実行) をお勧めします: http://www-lium.univ-lemans.fr/diarization/doku.php

Alice と Bob の区別に興味がある場合は、上記の Web サイトの Scripting ページにある Gender Detection の部分を参照してください (または、http://www-lium.univ-lemans.fr/diarization/dokuに直接アクセスしてください)。 .php/gender_detection )。

于 2014-05-30T05:41:30.293 に答える