Perl を使用して音声ファイルからテキストを抽出するメカニズムを提案するGoogle Speech APIの記事をたまたま見つけました。これで音声ファイルが録音されました。これはhttp://vocaroo.com/i/s0lPN5d3YQJjにあります。I love youと読むシンプルな音声です。Chrome で Google Speech API にアクセスしてこれらの言葉を話すと、正しい結果が得られます。指摘したオーディオ ファイルを使用して上記のリンクのコードを試すと、loganのような奇妙な結果が返されます。どうすればもっと正確にできますか?ffmpeg -i input.avi -vn -ar 44100 -ac 2 -ab 192 -f mp3 output.mp3
これは単なるサンプル オーディオです。私が一般的に行っているのは、FFMpeg を使用してビデオ ファイルからオーディオを抽出することですffmpeg -i input.mp3 output.flac
。
質問する
473 次