c# - サウンド周波数検出?

Question

音声ファイルから特定の単語を検出するソリューションは何ですか?

多くのオーディオファイル (同じコーデック) があり、各ファイルの長さは約 15 秒しかありません。（注：音声ファイルは全て同一人物・同一訛りです）

例えば：

test1.mp3再生Hello Tom, what are you doing today?

test2.mp3再生Hello Paul, what are you doing today?

test3.mp3再生Good morning John - It is lovely weather today

各オーディオファイルから素敵な天気やあなたの言葉を検出する方法が必要です。

100 個の音声ファイルに「今日何をしていますか」と言って、他のファイルに「今日何をしていますか?」と言うかもしれません。-各ファイルのステータス/タイプが何であるかを知る必要があるだけです..

音声認識ツールを使用するのではなく、周波数ビットが存在することを確認するソリューションは何ですか。

score 2 · Accepted Answer

あなたは本質的に「どうすれば汎用音声認識を行うことができますか」と尋ねていますか?

解決策は次のとおりです。

プラットフォームがすぐに使用できる音声認識を提供している場合は、それを使用してください。たとえば、Microsoft Windows はそうです。 http://msdn.microsoft.com/en-us/library/hh323805.aspx

プラットフォームがそうでない場合は、Lernaut & Hauspie (現在の Nuance)、Dragon などのサードパーティの音声認識パッケージを統合する必要があります。これには、おそらく料金の支払いが必要です。

編集:私はこれをText-to-speech (音声生成) API と speech-to-text (音声認識) APIの重複としてフラグを立てましたか? 、「音声認識を行うにはどうすればよいですか」に対する包括的な回答があります。

1 に答える 1