9

私は、生体認証システムを使用してシステムを保護するプロジェクトに取り組んでいます。システムを保護するために人間の声を使用する予定です。

アイデアは、人がいくつかの単語や文章を発声できるようにすることであり、システムはその声をデジタル形式で保存します。次に人がシステムに入りたいと思うとき、彼/彼女は、以前に使用された言葉と異なるかもしれないし、そうでないかもしれないいくつかの言葉を話さなければなりません。

単語を一致させたいのではなく、音声周波数を一致させたいのです。

このシステムに関するいくつかの研究論文を読みましたが、それらの論文には実装の詳細がありません。

アナログ音声をデジタル形式に変換でき、音声の周波数も教えてくれるソフトウェア/APIがあるかどうかを知りたいだけです。

今までは通常の Web ベースのアプリケーションを扱っていたので、Java EE や C# などの通常の API やプラットフォームについては知っていますが、この種のアプリケーションについては経験がありません。

啓発してください!!!

4

3 に答える 3

2

このようなプロジェクトには、次の 2 つのステップがあります。

最初のステップは、アナログ入力からの音声をデジタル形式 (wav-pcm と仮定します) に録音することです。これには、C# で DirectShow API を使用するか、次のプロジェクトのように標準の Wav-In を使用できます: http://www.codeproject.com/KB/audio-video/cswavrec.aspx。後で音声ファイルを圧縮することを検討する場合があります。これには多くのオプションがあります。Windows では、Windows Media Format SDK を検討して、他の形式のライセンスの問題を回避することができます。

2 番目のステップは、音声認識フレームワークを構築または使用することです。認識フレームワークを構築する場合は、サウンド フラグメントの一連の「機能」を定義し、認識アルゴリズムを選択して実装する必要があります。これには多くのアプローチがあり、IEEE と ACM.org の Web サイトは通常、優れた情報源です。既存のフレームワークを使用する場合は、Nuance Recognizer (商用) またはhttp://cmusphinx.sourceforge.net (オープン ソース) を検討してください。

お役に立てれば。

于 2011-03-07T16:27:44.940 に答える
2
于 2011-03-01T08:23:10.300 に答える
2

これは、他のどのサイトよりも優れた出発点です: http://marsyas.info/

これは、オーディオ処理用のオープン ソース ソフトウェア フレームワークです。彼らは、フレームワークをさまざまな方法で使用した一連のプロジェクトをリストしているので、おそらくそこからインスピレーションを得ることができます. http://marsyas.info/about/projects . 特に Telligence プロジェクトは、オーディオの性別分類に使用されていたため、ニーズに最も近いようです: http://marsyas.info/about/projects#5Teligence

于 2011-03-01T07:53:32.927 に答える