20

私はウェブサイトを開発しています。目の不自由な人が音声でウェブサイトを使用できるように支援したいので、以下を使用します。

  • ユーザーにいくつかの可能性を与えるテキスト読み上げ
  • 音声からテキストへ、ユーザーが自分の声を使っていずれかを選択できるようにする

私はすでにいくつかのテキスト読み上げ JavaScript ライブラリ ( speak.jsなど) を持っていますが、今は優れた音声読み上げライブラリが必要です。この目的のためのソリューションがいくつかありますが ( speechapi など)、それらは Java アプレットまたは Flash を使用しており、プラグインを避けるために JavaScript のみに依存したいと考えています。

私は HTML5 の音声入力を x-webkit-speech と Google Chrome で試しています。これは良いのですが、アイコンをクリックする必要があります (また、目の不自由な人はマウスをうまく使うことができません)。キーを押して x-webkit-speech を使用することは可能ですか? 代替 API (JavaScript) を知っていますか?

ありがとうございました!

4

2 に答える 2

4

キーを押して x-webkit-speech を使用することは可能ですか?

この投稿とこの投稿によると、マイクをクリックして発話の開始をオーバーライドすることはできません。

x-webkit-speech が行っていることは、HTML5 のオーディオ キャプチャ機能を使用し、処理のためにオーディオを Google のサーバーに送信し、結果を JSON で返すことです。このブロガーはそれをリバース エンジニアリングしました。HTML5 対応ブラウザでオーディオのキャプチャを開始するためのキー押下を検索し、それを Google のサービスまたは作成したサービスに送信する JavaScript ライブラリを開発できます。Google のサービスを使用することの欠点は、サポートされていない API であり、いつでも変更される可能性があることです。独自のサービスを開発することの欠点は、開発と保守に費用がかかることです。

代替 API (JavaScript) を知っていますか?

この投稿とこの投稿では、音声認識に使用できるいくつかのサービスを一覧表示しています。Nuance がリストされているのを見ませんでした。これにはDragon Mobile SDKを使用できる場合があります。また、 ISpeechにチェックインすることもできます。

于 2012-06-29T17:40:06.963 に答える
2

Google 翻訳は非常に優れた Text To Speech Engine です。私はそれでテキストを読んでいました。たとえば、テキストがあります。次のwelcome to Stack overflowように呼び出すことができます

http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input

次に、ブラウザのオーディオを使用して再生します

音声入力については、リスニング プロセスを手動で有効にすることができます。こちらを参照して ください http://code.google.com/chrome/extensions/experimental.speechInput.html

于 2012-06-28T09:38:55.573 に答える