3

Google API を使用した自然な会話による音声認識では優れた結果が得られましたが、Youtube の動画や映画の音声認識は不十分であるか、まったくありません。

スペイン語と英語の両方で私の声を iPhone 4 に録音することは認識されますが、映画で同じ電話を使用することはほとんど不可能です。成功したのは一度だけ。

ノイズレッドとコンパンド効果を使用してSoX (Sound eXchange)でサウンドをクリーンアップしようとしましたが、成功しませんでした。

何か案が?それとも単に、Google API で識別できない音を変更しただけですか? 他の音声認識ソフトウェアでうまくいくでしょうか?

4

1 に答える 1

0

Google 音声認識エンジン (および他のほとんどの認識エンジン) は、残響効果と互換性がありません。ほとんどのビデオ シーンでは、人とマイクの間の距離は 1 ~ 3 メートル以上です。携帯電話をテーブルに置き、3 メートルの距離からスムーズに認識してみてください。これは何にもつながりませんが、音質は非常に良くなります。

于 2014-07-25T06:52:25.517 に答える