音声パターンを分析する方法/ライブラリを探しています。たとえば、部屋には6人がいます。それぞれを音声で識別したい。
ヒントは大歓迎です。
ドミトリー
音声パターンを分析する方法/ライブラリを探しています。たとえば、部屋には6人がいます。それぞれを音声で識別したい。
ヒントは大歓迎です。
ドミトリー
連続した長い音声録音を取り、各話者の声の特徴を事前に知らずに、1 人の話者だけが話しているチャンクに分割するタスクは、「話者ダイアライゼーション」と呼ばれます。ウィキペディアのページに研究コードへのリンクがあります。
各音声の以前の録音があり、むしろ分類を行いたい場合、これは少し異なる問題です (話者認識または話者識別)。そのためのソフトウェア ツールはこちらから入手できます(Sphinx や HTK などの汎用の音声認識パッケージは、そうするように誘導されるほど柔軟です)。
ここで回答https://dsp.stackexchange.com/questions/3119/library-to-differentiate-people-by-their-voice-timbre