2

音声ファイルから特定の単語を検出するソリューションは何ですか?

多くのオーディオ ファイル (同じコーデック) があり、各ファイルの長さは約 15 秒しかありません。(注:音声ファイルは全て同一人物・同一訛りです)

例えば:

test1.mp3再生Hello Tom, what are you doing today?

test2.mp3再生Hello Paul, what are you doing today?

test3.mp3再生Good morning John - It is lovely weather today

各オーディオ ファイルから素敵な天気あなたの言葉を検出する方法が必要です。

100 個の音声ファイルに「今日何をしていますか」と言って、他のファイルに「今日何をしていますか?」と言うかもしれません。-各ファイルのステータス/タイプが何であるかを知る必要があるだけです..

音声認識ツールを使用するのではなく、周波数ビットが存在することを確認するソリューションは何ですか。

4

1 に答える 1

2

あなたは本質的に「どうすれば汎用音声認識を行うことができますか」と尋ねていますか?

解決策は次のとおりです。

プラットフォームがすぐに使用できる音声認識を提供している場合は、それを使用してください。たとえば、Microsoft Windows はそうです。 http://msdn.microsoft.com/en-us/library/hh323805.aspx

プラットフォームがそうでない場合は、Lernaut & Hauspie (現在の Nuance)、Dragon などのサード パーティの音声認識パッケージを統合する必要があります。これには、おそらく料金の支払いが必要です。

編集:私はこれをText-to-speech (音声生成) API と speech-to-text (音声認識) APIの重複としてフラグを立てましたか? 、「音声認識を行うにはどうすればよいですか」に対する包括的な回答があります。

于 2012-05-03T15:45:17.633 に答える