6

pyspeech APIを使用してmp3(音声からテキスト)を書き起こしたいのですが。しかし、これが可能かどうかはわかりません。

それは...ですか?どのように?

4

2 に答える 2

2

pyspeechは、通常のWindows音声APIへの単なるPythonインターフェイスのようです。ほとんどの場合、mp3再生をその音声APIが聞くためのオーディオソースとして扱う何らかの方法を作成します。

于 2011-01-06T03:10:40.017 に答える
2

pyspeechについてはわかりませんが、Microsoftの音声APIのPythonラッパーである場合は、他のいくつかの投稿が役立つ可能性があります。

Microsoft音声エンジンはマイク入力を必要としません。彼らはオーディオファイルを受け入れることができます。

音声文字変換を行う場合は、ディクテーション文法が必要になります。ディクテーション文法は、Windows7およびVistaに同梱されているMicrosoft音声エンジンのクライアントバージョンに含まれています。ディクテーション文法は、Microsoftが提供するサーバーエンジンでは提供されていません。

System.Speech名前空間を使用してC#でディクテーション文法を使用する簡単な例は、StackOverflowの質問SAPIとWindows7の問題にあります。

于 2011-01-07T13:46:28.007 に答える