問題タブ [speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python での音声認識
Speech モジュールを見つけたので、自分の書いたものをコンピュータに話させることができます。しかし、問題は、ここからサンプルコードを試してみるときです: http://pypi.python.org/pypi/speech/0.5.1エラーが発生して実行できません。これは私が得るエラーです:
誰かが私を助けてくれることを本当に願っています。
事前にどうもありがとう、
ジェイク
speech-recognition - MS Speech Recognition サーバー API を使用した書き起こし
ディクテーション文法の読み込みは、サーバー バージョンの MS Speech API (Microsoft.Speech) ではサポートされていません。
Q1: それを回避する方法はありますか?
Q2: 私が思いついたアイデアの 1 つは、人々が特定のトピックについて行った会話 (たとえば、チャット ルーム) の履歴に基づいて文法を構築することです。ソフトウェアは自然言語の書き起こしを行う必要がありますが、使用される言語のサブセットは多少制限される可能性があります。
これが合理的に正確で堅牢である可能性はありますか? それとも、非指定文法で行うことを意図していないものですか?
ありがとう
1月
speech-recognition - 音声認識と音声合成を始める
音声認識に基づくプロトタイプで音声認識と音声合成を開始したい 誰かがマイクロソフトの音声サーバー(SDKなど)を使用するように言った
これを持っている場合、どのようにアプリケーションをプログラミングし、どのプログラミング言語(開発環境?)でプログラミングしますか?
アスタリスクまたはSVOXの経験はありますか?
私はする必要があります:
音声認識音声合成
私は非常に優れた音声認識である必要はありません-最初は30〜50語で十分だと思います。私はウィンドウズで働いています。
前もって感謝します
php - ISpRecoGrammar::PHP で IsPronounceable?
文字列の「発音可能性」をテストできるものを追跡しようとしていましたが、実際には無料で入手できるものがあるとは思えません。
Microsoft がライブラリを持っていることを知って、私は少し驚きました。 http://msdn.microsoft.com/en-us/library/ms718902(VS.85).aspx
これは、おそらく他の場所に存在するか、生成された文字列が発音可能。
どのように問題に取り組みますか? 難しさ: LAMP システムでそれを実現します (私の Web サーバーに単語の PINDEX を自動的に分類してもらいたいです)。
編集:おお...さらにクールなリンクが見つかりました。涼しい!:)
http://www.addedbytes.com/code/flesch-kincaid-function/
文字列がランダム化されているか、人間が生成して発音できるかを確認する方法は?
EDIT2:
オーマイ!利用可能なGoogleコードプロジェクトがあります:
http://code.google.com/p/php-text-statistics/
なんとか機能させることができた場合は、簡単なチュートリアルでフォローアップします。
iphone - 音声からテキストへの API または SDK (音声認識) iphone
こんにちは、ユーザーが話した音声を認識してテキスト形式にする音声認識 API または SDK が必要です。
詳細な説明は次のとおりです。
私のアプリケーションでは、オーディオ ファイルとそのテキストを再生する必要があります。音声の再生が始まると、(音声ファイルから) 話されている単語が強調表示されます。
したがって、api または sdk から単語を取得できれば、それを強調表示できます。
それとは別に、私はAPIについて多くのグーグル検索を行い、 ceedvocalsdkに出くわしましたが、無料試用版は利用できません.
誰かが私の要件または api または sdk にこれ以外のアイデアを提供できる場合、私は非常に感謝します。
xml - SpeechServer上のVXML
質問があります。http: //www.vxml.org/frame.jsp?page = t_1.htmで、voicexmlファイルを.xmlとして保存する必要があると書かれています。
しかし、speech Server 2007で新しいアプリケーションを作成すると、そこに.speaxファイルしか配置できないと表示されます...
しかし、私がそうするとき、それは機能しません...
.speaxとして保存する必要がありますか?サーバー上に新しいアプリケーションを作成することで何か問題がありますか?
ありがとう:>
android - アルファベットの文字を発音するようにTextToSpeechを説得する
TextToSpeechにAndroidエミュレーターで英数字の参照を話させようとしています。「31NAA123」などの文字列がある場合は、すべての文字の間にスペースを挿入してから、speakメソッドに送信します。ほとんどの文字で問題なく処理できますが、「A」でつまずきます。クリック音とほぼ同じくらい短い、ほとんど聞こえない非常に短い「ah」として出力されます。「ay、why」と表示されるreplaceAll( "A"、 "AY")を試してみました。私は0.3fまでのほとんどの発話速度を試しました-何も機能しません。イギリスのアクセントを付けるためにイギリスのロケールを使用しています。誰かが何か役に立つ提案をしてくれたらありがたいです。
(「i」でも同様の問題が発生すると思われますが、「o」は問題ないようです)
.net - 音声トラックを比較するためのライブラリが必要(発音)
2つの音声サンプルがあります(wavまたはmp3)。両方を比較し、比較の係数を設定する必要があります。
RosettaStoneのような発音を訓練する必要があります。
.netにはlibsを優先します。
python - Python Microsoft Speech APIエラー:CmdLoadFromFileのSPERR_NO_DRIVER
この質問には答えられないかもしれませんが、私はこの問題について助けを求めています。PythonでMicrosoftのSpeechAPIを処理するためのコードスニペットを見つけて、W3Cの「SpeechRecognitionGrammarSpecificationVersion1.0 」について学びました。
私はそれをこれに煮詰めました:
私が発見したことから、上記のエラーコードは「SPERR_NO_DRIVER」に対応しており、「ウェーブドライバーがインストールされていません」と関係があります。
私は今立ち往生しています。このコンテキストで、Waveドライバーが何であるか、どこにあるか、どのようにデバッグするかなどはわかりません。何か考えはありますか?
speech-recognition - 台本読み上げ時の音声分析・検証
既知のスクリプトを読み取る録音された音声をプログラムで分析する必要があります。出力は、読み取った単語がどこにあるか (時間座標で) を教えてくれるはずです (少なくともそれらのいくつか)。
この技術(録音された音声が特定のテキストを正確かつ明確に読んでいることを自動的に検証する)を使用した「音声検証」サービスの市場があることを発見しましたが、必要なソフトウェアまたは lib/SDK を見つけることができませんでした。からの出力。
この種のテクノロジーがどれほど優れているか、どこで見つけられるかについて、誰かが私に洞察を与えることができますか? プレミアム サービス、完全なアプリケーション、ライブラリ、SDK など、機能するものは何でも興味があります。予算:不明。
編集: 大きなヨーロッパ言語のサポートは多かれ少なかれ必要です。英語、フランス語、ドイツ語、スペイン語、ギリシャ語、イタリア語、ロシア語、ポーランド語が良いでしょうが、それ以上のものも大歓迎です。これを実現するのはおそらく難しいでしょう...