3

こんばんは、私は Kinect を使用したプロジェクトに取り組んでおり、センサーのマイクでキャッチされた音声情報を使用して性別認識を実行する必要があります。認識はテキストベースにすることもできます。つまり、ユーザーが話す文は常に同じにすることができます。私は「ちょうど」男性/女性のバイナリの答えが必要です。

非常に人気のあるオープンソースの Sphinx を確認しましたが、それが自分のニーズに使用できるかどうかわかりません。

私が何を使うことができるかについて何か考えはありますか?
前もって感謝します。

4

2 に答える 2

2

完全を期すために、最後に、音声入力を分析せずに認識タスクを解決しました。

性別は、視覚的な生体特徴を学習してから分類することによっても、許容できる精度で検出できます。デモを起動するための「インターフェース」としてのみ、音声認識を使用しました。

于 2013-09-11T09:04:27.513 に答える
0

これを実現するにはいくつかの方法があります。ピッチを追跡できます (低いピッチ値は男性になり、それ以外の場合は女性になります)。または、男性用のモデル、女性用のモデル、子供用のモデルを使用して、GMM を作成してみてください (Sphinx はこれを実行できませんが、HTK は実行できます)。

于 2012-05-02T23:46:07.510 に答える