speech-to-text - Mp3/Wavからテキストへ

Question

私は現在、音声をWAVまたはMP3として録音できるモバイルアプリケーションを持っており、それをテキストに変換したいと考えています。私は周りを見回しました-MicrosoftSpeech、UCMAなど-しかしそれを行う方法の良い例を見たことがありません。誰かがここで手伝ってもらえますか？

参考までに-MSLyncにアクセスできます。

ジェームス、どんな返事も楽しみにしています

score 0 · Accepted Answer

UCMA 3.0 SDKを使用して音声認識を実行するサンプルがあります。これは、こちらから入手できます。ただし、経験から（そして、ここで間違っていることが証明されるのが大好きです）、事前に決定された一連のオプションからの特定の応答しか認識できません。したがって、「今日はどうでしたか」と尋ねて、有効な応答が「良い」、「普通」、「悪い」であることをUCMAに伝えると、それらのいずれかに一致しようとします。私はそれが言論の自由の変換を「ただ」行うことができるのを見たことがありません。（はるかに難しい問題）

これは、MicrosoftSpeechAPIの方が優れている可能性があります。この投稿を試してみてください。

speech-to-text - Mp3/Wavからテキストへ

1 に答える 1

Related

Reference