Python を使用して音声ベースのパーソナル アシスタントを開発しています。いくつかのオープンソース プロジェクトの助けを借りました。音声からテキストへのエンジン用の API があります。私のアシスタントは最初に音声を録音し、次に API を使用して音声を送信し、転写されたコマンドを返します。siri、cortana、google now、houndify、Web サービスなどの他のプラットフォームは、即時のようにリアルタイムでそれを行います。
これらのエンジンのように、音声からテキストへの即時変換を実現するにはどうすればよいでしょうか?