オーディオのバッファがあり、それに対して音声認識/文字起こしを実行したいと考えています。ローカルで CPU と RAM が制限されているため、サーバー上で認識を実行したいと考えています。
これを可能にする (Web) サービスはありますか?
これまでの私の検索はどこにも行きませんでした...
オーディオのバッファがあり、それに対して音声認識/文字起こしを実行したいと考えています。ローカルで CPU と RAM が制限されているため、サーバー上で認識を実行したいと考えています。
これを可能にする (Web) サービスはありますか?
これまでの私の検索はどこにも行きませんでした...
Google has just introduced browser-based access to its speech engine through HTML5.
http://slides.html5rocks.com/#speech-input
To get this page to work, I launched the Chromium browser as follows in Ubuntu:
$ chromium-browser --enable-speech-input
I believe that the idea is to be able to build applications that use Google's speech recognizer, but I haven't had a chance to look deeply into it.
Another interesting project is WAMI from MIT: http://wami.csail.mit.edu
Lumenvoxはそのようなサービスを提供していますが、ニーズに対して高価に思えます。