Google API を使用した自然な会話による音声認識では優れた結果が得られましたが、Youtube の動画や映画の音声認識は不十分であるか、まったくありません。
スペイン語と英語の両方で私の声を iPhone 4 に録音することは認識されますが、映画で同じ電話を使用することはほとんど不可能です。成功したのは一度だけ。
ノイズレッドとコンパンド効果を使用してSoX (Sound eXchange)でサウンドをクリーンアップしようとしましたが、成功しませんでした。
何か案が?それとも単に、Google API で識別できない音を変更しただけですか? 他の音声認識ソフトウェアでうまくいくでしょうか?