1

Perl を使用して音声ファイルからテキストを抽出するメカニズムを提案するGoogle Speech APIの記事をたまたま見つけました。これで音声ファイルが録音されました。これはhttp://vocaroo.com/i/s0lPN5d3YQJjにあります。I love youと読むシンプルな音声です。Chrome で Google Speech API にアクセスしてこれらの言葉を話すと、正しい結果が得られます。指摘したオーディオ ファイルを使用して上記のリンクのコードを試すと、loganのような奇妙な結果が返されます。どうすればもっと正確にできますか?ffmpeg -i input.avi -vn -ar 44100 -ac 2 -ab 192 -f mp3 output.mp3これは単なるサンプル オーディオです。私が一般的に行っているのは、FFMpeg を使用してビデオ ファイルからオーディオを抽出することですffmpeg -i input.mp3 output.flac

4

1 に答える 1

2

作成中の音声ファイルを再生してみましたか?

途方もなく低い 192 ビット/秒のオーディオ ビットレートを設定しています。

192Kbps の場合は が必要-ab 196608です。

于 2012-08-04T18:16:35.793 に答える