security - 人間の声をデジタル形式に変換する方法は?

Question

私は、生体認証システムを使用してシステムを保護するプロジェクトに取り組んでいます。システムを保護するために人間の声を使用する予定です。

アイデアは、人がいくつかの単語や文章を発声できるようにすることであり、システムはその声をデジタル形式で保存します。次に人がシステムに入りたいと思うとき、彼/彼女は、以前に使用された言葉と異なるかもしれないし、そうでないかもしれないいくつかの言葉を話さなければなりません。

単語を一致させたいのではなく、音声周波数を一致させたいのです。

このシステムに関するいくつかの研究論文を読みましたが、それらの論文には実装の詳細がありません。

アナログ音声をデジタル形式に変換でき、音声の周波数も教えてくれるソフトウェア/APIがあるかどうかを知りたいだけです。

今までは通常の Web ベースのアプリケーションを扱っていたので、Java EE や C# などの通常の API やプラットフォームについては知っていますが、この種のアプリケーションについては経験がありません。

啓発してください!!!

score 2 · Accepted Answer

このようなプロジェクトには、次の 2 つのステップがあります。

最初のステップは、アナログ入力からの音声をデジタル形式 (wav-pcm と仮定します) に録音することです。これには、C# で DirectShow API を使用するか、次のプロジェクトのように標準の Wav-In を使用できます: http://www.codeproject.com/KB/audio-video/cswavrec.aspx。後で音声ファイルを圧縮することを検討する場合があります。これには多くのオプションがあります。Windows では、Windows Media Format SDK を検討して、他の形式のライセンスの問題を回避することができます。

2 番目のステップは、音声認識フレームワークを構築または使用することです。認識フレームワークを構築する場合は、サウンドフラグメントの一連の「機能」を定義し、認識アルゴリズムを選択して実装する必要があります。これには多くのアプローチがあり、IEEE と ACM.org の Web サイトは通常、優れた情報源です。既存のフレームワークを使用する場合は、Nuance Recognizer (商用) またはhttp://cmusphinx.sourceforge.net (オープンソース) を検討してください。

お役に立てれば。

score 2 · Accepted Answer

http://www.loquendo.com/en/products/speaker-verification/
http://www.nuance.com/for-business/by-solution/contact-center-customer-care/cccc-solutions-services/verifier/index.htm
(報告されたウイルスコンテンツのため、2 つのリンクが削除されました)
http://www.persay.com/products.asp

score 2 · Accepted Answer

これは、他のどのサイトよりも優れた出発点です: http://marsyas.info/

これは、オーディオ処理用のオープンソースソフトウェアフレームワークです。彼らは、フレームワークをさまざまな方法で使用した一連のプロジェクトをリストしているので、おそらくそこからインスピレーションを得ることができます. http://marsyas.info/about/projects . 特に Telligence プロジェクトは、オーディオの性別分類に使用されていたため、ニーズに最も近いようです: http://marsyas.info/about/projects#5Teligence

security - 人間の声をデジタル形式に変換する方法は?

3 に答える 3

Related

Reference