1

私は、オーディオ ファイルの周波数データを読み取ることによって、何らかの形で性別を検出する方法をあらゆる場所で探してきました。それを実行できるプログラム、またはオーディオデータを出力できるプログラムを見つけることができなかったので、基本的なプログラムを作成してそれを読み取り、それを操作して話者の性別を判断できます。

これについて私を助ける何かをどこで見つけることができるか知っている人はいますか?

繰り返しますが、私は基本的に、人がマイクに向かって話すときに、話者の性別をかなりの精度で言うプログラムが必要です。私の完全な計画は、スピーチからテキストへの機能も搭載することです。そのため、プログラムはスピーカーが言ったことを書き出し、スピーカーにいくつかの非常に基本的な人口統計を提供します.

*できれば、クロス プラットフォームまたは Linux をサポートする共通のスクリプト言語を使用します。

4

2 に答える 2

1

フォルマント検出と線形予測コーディングを調べたいと思うでしょう。scipy/numpy に移植できるいくつかのシグナル フロー ダイアグラムを含む論文を紹介します。

于 2013-02-04T06:24:22.127 に答える