0

私はいくつかの基本的なコマンド認識を行っており、そのために Google Search Input API を使用しています。ただし、自分でオーディオをキャプチャし、オーディオを前処理 (ノイズ除去、振幅のブーストなど) し、それらの変更されたオーディオをレコグナイザーに送信して結果を取得したいと考えています。出来ますか?

メソッドを使用してオーディオを取得するためSpeechRecognizerに と一緒に使用できることを知っています。ただし、後処理ではなく前処理を行いたいです。処理されたデータを Google 認識エンジンにフィードするための回避策/ハックはありますか?RecognitionListeneronBufferReceived

4

1 に答える 1

0

オーディオを前処理し(ノイズ除去、振幅のブーストなど)、それらの変更されたオーディオをレコグナイザーに送信して結果を取得します

通常、音声認識システムはこれに苦しんでいます。ノイズ除去が正しく実装されていないと、予測できない方法でスペクトルが破損するため、音声認識の精度が低下する可能性があります。振幅は音声認識の最初の段階で正規化されるため、振幅のブーストは役に立ちません。あなたの前処理は傷つくだけです。

それでも試してみたい場合は、pocketsphinxを試してください

http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/

于 2012-05-15T05:16:38.960 に答える