perl - 音声がファイルで送信されると、Google Speech API で正しい結果が得られない

Question

Perl を使用して音声ファイルからテキストを抽出するメカニズムを提案するGoogle Speech APIの記事をたまたま見つけました。これで音声ファイルが録音されました。これはhttp://vocaroo.com/i/s0lPN5d3YQJjにあります。I love youと読むシンプルな音声です。Chrome で Google Speech API にアクセスしてこれらの言葉を話すと、正しい結果が得られます。指摘したオーディオファイルを使用して上記のリンクのコードを試すと、loganのような奇妙な結果が返されます。どうすればもっと正確にできますか？ffmpeg -i input.avi -vn -ar 44100 -ac 2 -ab 192 -f mp3 output.mp3これは単なるサンプルオーディオです。私が一般的に行っているのは、FFMpeg を使用してビデオファイルからオーディオを抽出することですffmpeg -i input.mp3 output.flac。

score 2 · Accepted Answer

作成中の音声ファイルを再生してみましたか?

途方もなく低い 192 ビット/秒のオーディオビットレートを設定しています。

192Kbps の場合はが必要-ab 196608です。

perl - 音声がファイルで送信されると、Google Speech API で正しい結果が得られない

1 に答える 1

Related

Reference