さまざまなテキスト読み上げエンジンをサポートする、当社製品のテキスト読み上げモジュールの開発を依頼されました。
サードパーティの TTS (テキスト読み上げ) サービスまたは ASR (自動音声認識) サービスとのインターフェース方法を説明する標準はありますか?
さまざまなテキスト読み上げエンジンをサポートする、当社製品のテキスト読み上げモジュールの開発を依頼されました。
サードパーティの TTS (テキスト読み上げ) サービスまたは ASR (自動音声認識) サービスとのインターフェース方法を説明する標準はありますか?
ほとんどの ASR は、Media Resource Control Protocol (MRCP)をインターフェイスの標準として使用します。TTS にも使用できます。
それは、目的や、ASR と TTS を使用する分野によって異なります。
MRCP をコール センターなどの IVR (Interactive Voice Response) アプリで使用する場合は、MRCP を使用して ASR、TTS メディア リソースを制御できます。この場合、MRCP サーバーを CISCO や VXML サーバーなどの Voice Gateway と接続します。有名で一般的な MRCP 実装はunimrcpであり、プロトコルの C 実装であり、優れた安定したオープン ソース プロジェクトです。
しかし最後に、私が言ったように、それはあなたの目的に依存します.MRCPを使用する必要はないかもしれません.TTSエンジンが単独で動作する場合は、スタンドアロンサーバーとして使用できます.
有名なオープンソース TTS エンジンは、Java で書かれたMary TTSと C++ で書かれたFestivalです。
有名なオープン ソース ASR エンジンは、Java で書かれたcmu Sphinx4、C で書かれたJuliusです。