speech-recognition - Text-to-speech (音声生成) および speech-to-text (音声認識) API?

Question

デスクトップまたはブラウザ環境向けの既知の API の包括的なリストはありますか?

score 31 · Accepted Answer

C または Java または PHP での音声認識からの回答を再ハッシュして更新しますか? . これは決して包括的なものではありませんが、あなたにとっての出発点になるかもしれません

これらの質問を数か月間見てきた結果、ほとんどの開発者の選択が次のように分類されることがわかりました。

Windows ユーザー - .Net または Microsoft.Speech の System.Speech 機能を使用し、Microsoft が提供する無料の認識機能をインストールします。Windows 7 には、完全な音声認識エンジンが含まれています。その他は無料でダウンロードできます。SAPI として知られている同じエンジンへの C++ API があります。http://msdn.microsoft.com/en-us/magazine/cc163663.aspxを参照してください。またはhttp://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx。Windows 用 Microsoft エンジンの詳細な背景 System.Speech.Recognition と Microsoft.Speech.Recognition の違いは何ですか?

Linux 関係者 - Sphinx は好評のようです。http://cmusphinx.sourceforge.net/およびhttp://cmusphinx.sourceforge.net/wiki/を参照してください。

商用製品 - Nuance、Loquendo、AT&T、IBM、その他。それぞれが、さまざまな言語用の独自の SDK とライブラリを提供します。

オンラインサービス - Nuance、Yapme、ispeech.org、vlingoなど。Nuance は開発者プログラムを改善し、開発用のサービスに無料でアクセスできるようになりました。Yap (と思います) は最近Amazonに買収されたので、いくつかの変更が見られるかもしれません。

もちろん、これも役立つかもしれません - http://en.wikipedia.org/wiki/List_of_speech_recognition_software

Java 音声 API があります。Java Speech API http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.htmlの javax.speech.recognition を参照してください。この API をサポートする音声エンジンを見つける必要があると思います。Sphinx が完全にサポートしているとは思わない - http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi

他にもたくさんの SO 質問があります: Linux およびpyspeech (python)用のテキストから音声への変換および音声認識ツールが必要です- mp3 ファイルを転写しますか? http://code.google.com/p/pyspeech/について話します。http://code.google.com/p/dragonfly/もご覧ください。

score 2 · Accepted Answer

テキスト読み上げ（音声生成）の主要な API ベンダーはYAKiToMe! そしてiSpeech。やきとめ！私が使っているのは、彼らの声の質が一番好きで、最も安価 (ほとんどが無料) であるためです。複数の言語で男性と女性の話者をサポートします。Acapella、Nuance、Loquendo、iVona などの一部の音声ベンダーは、まともな音声を提供していますが、使用するのに費用がかかる傾向があります。

score 1 · Accepted Answer

これを行う方法は次のとおりです。注: これは Google の API であるため、Chrome ブラウザでのみ機能します。

(ライブデモを参照し、ここから完全なソースコードをダウンロードしてくださいhttp://purpledesign.in/blog/?p=33 )

ボタンを定義する

<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" />

JavaScriptファイルの関数で何をしたいのかを定義します

このような

   function processspeech()
   {
     var speechtext=$("#speech").val();
     var elem = document.getElementById("test");
     elem.value = speechtext;
     var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+  speechtext + "</span>\" <br />*Is this what you said???";
    notify(notification);
}

ここ

<textarea> id="test"></textarea>

スピーチはテキストエリアに書かれています

speech-recognition - Text-to-speech (音声生成) および speech-to-text (音声認識) API?

3 に答える 3

Related

Reference