open-source - 音声を使った性別認識のためのオープンソースツール

Question

こんばんは、私は Kinect を使用したプロジェクトに取り組んでおり、センサーのマイクでキャッチされた音声情報を使用して性別認識を実行する必要があります。認識はテキストベースにすることもできます。つまり、ユーザーが話す文は常に同じにすることができます。私は「ちょうど」男性/女性のバイナリの答えが必要です。

非常に人気のあるオープンソースの Sphinx を確認しましたが、それが自分のニーズに使用できるかどうかわかりません。

私が何を使うことができるかについて何か考えはありますか？
前もって感謝します。

score 2 · Accepted Answer

完全を期すために、最後に、音声入力を分析せずに認識タスクを解決しました。

性別は、視覚的な生体特徴を学習してから分類することによっても、許容できる精度で検出できます。デモを起動するための「インターフェース」としてのみ、音声認識を使用しました。

score 0 · Accepted Answer

これを実現するにはいくつかの方法があります。ピッチを追跡できます (低いピッチ値は男性になり、それ以外の場合は女性になります)。または、男性用のモデル、女性用のモデル、子供用のモデルを使用して、GMM を作成してみてください (Sphinx はこれを実行できませんが、HTK は実行できます)。

open-source - 音声を使った性別認識のためのオープンソース ツール

2 に答える 2

Related

Reference

open-source - 音声を使った性別認識のためのオープンソースツール