android - Android Speech Input Recognizer でオーディオを前処理する

Question

私はいくつかの基本的なコマンド認識を行っており、そのために Google Search Input API を使用しています。ただし、自分でオーディオをキャプチャし、オーディオを前処理 (ノイズ除去、振幅のブーストなど) し、それらの変更されたオーディオをレコグナイザーに送信して結果を取得したいと考えています。出来ますか？

メソッドを使用してオーディオを取得するためSpeechRecognizerにと一緒に使用できることを知っています。ただし、後処理ではなく前処理を行いたいです。処理されたデータを Google 認識エンジンにフィードするための回避策/ハックはありますか?RecognitionListeneronBufferReceived

score 0 · Accepted Answer

オーディオを前処理し（ノイズ除去、振幅のブーストなど）、それらの変更されたオーディオをレコグナイザーに送信して結果を取得します

通常、音声認識システムはこれに苦しんでいます。ノイズ除去が正しく実装されていないと、予測できない方法でスペクトルが破損するため、音声認識の精度が低下する可能性があります。振幅は音声認識の最初の段階で正規化されるため、振幅のブーストは役に立ちません。あなたの前処理は傷つくだけです。

それでも試してみたい場合は、pocketsphinxを試してください

http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/

android - Android Speech Input Recognizer でオーディオを前処理する

1 に答える 1

Related

Reference