-4

私はコンピュータサイエンスの学生であり、最終年度のプロジェクトを完了する必要があります。これは実際にはプロジェクト全体の中で最も複雑な側面のように思われるので、私はタイトルの提案を探しています。基本的に、私のプロジェクトは次のとおりです。

  • 音声を分析するアルゴリズムを開発します。具体的には、誰かが「はい」または「いいえ」のどちらかを言っているかどうかを検出し、その人が男性か女性かを判断します。

@mmoment

サンプル(人の声)が「はい」と「いいえ」のどちらであるかを判断するアルゴリズムを開発します。このアルゴリズムは、サンプルをブロックに分割し、各ブロックのゼロ交差を見つけ、HMMを使用して、誰かが「はい」または「いいえ」のどちらかを言っているかどうかを判断することで機能します。これは、電話を選ぶことでできると私は信じています。たとえば、電話「Y」が選択されている場合、その単語は「はい」であると推測できますが、電話が「Y」/または/「N」でない場合、その単語は「いいえ」であると推測できます。これは意味がありますか?

この問題に関連するいくつかの問題があります。私は知っています。最終的な提案を提出する前に、それらを「解決」し、うまくいけば最終的な決定を下します。

誰かが私を助けてくれることを願っています:)!

4

1 に答える 1

1

私の友人が同様のプロジェクトに取り組み、音声認識のための隠れマルコフ連鎖/モデルの使用を評価しました。

http://en.wikipedia.org/wiki/Hidden_​​Markov_model

また、Matlab の使用を強くお勧めします (ただし、いくつかの特別なツールボックスが必要です)。

@Phorceゼロクロッシングを行う代わりに、時間連続信号を別のドメインに転送し(とにかく、時間離散フーリエドメインに転送します)、ベース周波数と重要なリップル高調波周波数の発生を確認してみませんか?それはYESかNOかの違いを決定するトリックを行うはずです. これにより、振幅の重要な関連性が無視され、区別はかなり簡単になります。ここでの実際のタスクは、さまざまな発音を決定することです。これはおそらく、信号/帯域幅のストレッチまたは周波数ドメインのシフトにすぎません。

周波数ドメインのシフトは、女性の話者と男性の話者を区別するのにも役立ちます..しかし、システムがさまざまな話者、声などを学習/適応できるように、おそらく何らかの形式のニューラルネットワークを使用する必要があります..!

于 2012-08-30T13:49:56.490 に答える