問題タブ [webspeech-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
153 参照

javascript - Web Speech API in_array

このコードがあり、それが魅力のように機能する場合、最初の結果の後、in_array 関数は「false」のみを返します。問題が見つかりません。認識を再開するたびに、1つのフレーズに対して機能します...

jsfiddle をテストする場合: http://jsfiddle.net/p3Fxc/

0 投票する
0 に答える
530 参照

javascript - Web Speech で Safari iOS がクラッシュする

私は Mobile Safari で音声合成を行っていますが、特に音声中に DOM が操作されている場合、非常に不安定であることがわかりました。iPad 上の iOS 7.1.1 で Safari (または Webview) をクラッシュさせる簡単なテスト ケースを作成しました (ただし、OS X Safari では問題なく動作します)。次の HTML ページがモバイル Safari を強制終了する理由を知っている人はいますか?

0 投票する
1 に答える
1797 参照

javascript - Web Speech API の遅延時間 -- 修正方法は?

Web ページで Web Speech API を使用しています。しかし、結果を返すのに 3 ~ 5 秒かかることがわかりました。これは、今日の Web の世界ではかなりの遅延時間です。他の誰かがこの問題を抱えていますか? 誰かが解決策を見つけましたか?

ここに私がこれまでに持っているものの要点があります-それ自体は機能しますが、より高速にする必要があります。

0 投票する
1 に答える
2362 参照

node.js - Google Chrome で Web Speech API 実装を使用して、標準 API のレート制限を回避しますか?

Google の Speech API を直接使用するには、API キーを取得する必要があります。そのキーを取得するには、chromium-dev@chromium.org ニュースグループに登録する必要があります。その後、いくつかの手順を実行すると、Google から「配布用ではない」開発者キーが提供されます。キーは、1 日あたり 50 リクエストにレート制限されています。

たとえば、node-google-speech-api は、ノード アプリケーションが Google の Speech API に直接 (ブラウザを使用せずに) アクセスするために、このキーが必要であることを示しています: https://github.com/psirenny/node-google-音声 API

Google の Speech API にアクセスするための PHP ライブラリと Java ライブラリもあり、これにもこのキーが必要です。

Google の音声認識テクノロジを利用するデスクトップ アプリケーションを作成したいと考えていますが、1 日あたり 50 リクエストという制限は、広範囲に配布する場合や、想定しているソフトウェアを単一のデスクトップに展開する場合でも受け入れられません。音声認識が何らかの形で壊れている場合、個々のデスクトップ ユーザーによって 1 日に最大 500 のリクエストが表示されます。これらのほとんどはおそらくロング ポーリング/継続的であるため、1 日に 2 つか 3 つのリクエストしかないかもしれませんが、数時間かかる可能性があります。時間。これに数百人のユーザーを掛けると、1 日あたり 50 件のリクエストを簡単に超えてしまいます。

私は自分のアプリでデスクトップ上の Google の優れた音声認識技術にアクセスする方法を考えようとしていました (言語は問題ではありませんが、node.js がミックスの一部になる可能性が高いため、node.js ソリューションが優先されます)。この制限により、Google Chrome がたまたま実装している Web Speech API 標準を検討するようになりました。

私が知る限り、Google Chrome の Web Speech API の実装に要求/日の厳しい制限はありません。Google Speech API と比較して、制限なしまたは最小限の制限で、一日中 Web Speech API を使用する Web サイトを喜んで作成できました。直接。これにより、Chrome (Chromium ではなく) ブラウザーを配布した場合、つまり正真正銘の Google Chrome ブラウザーに「拡張機能」を追加して、カスタム html5 Web ページ内の JavaScript がクライアントの他のアプリケーションとインターフェイスできるようにしたらどうなるかを考えるようになりました。システム (つまり、Chrome のこの特別なインストールと一緒に実行される Node.js アプリ) を作成し、Web Speech API スタイルの Javascript で音声認識部分を記述し、その出力を、私が設計してクライアントのシステムにインストールした他のアプリケーションにパイプしました。

それはうまくいくでしょうか?

このアプローチの落とし穴は何ですか?

別のアプローチの提案はありますか、それとも、Google の音声技術の使いやすさと極端な自然言語精度に匹敵する商用ライセンスのソリューションをお勧めしますか?

0 投票する
4 に答える
1726 参照

speech-synthesis - 音声合成 API のボリューム、レート、およびピッチが機能しない

要するに、音声合成の音量、レート、およびピッチが機能しません。この問題を抱えていて、それを解決する方法を知っている人は他にいますか、それとも私だけですか?

長い話:

私にとっては、音声合成の音量、速度、およびピッチが機能しません。ここに私の音声機能があります:

ただし、呼び出すspeak("Hello", 0, 0, 0.1)と、とまったく同じものが出力されspeak("Hello")ます。同じものを出力したいのですが、もっと柔らかくしたいです。

現在、http://updates.html5rocks.com/2014/01/Web-apps-that-talk---Introduction-to-the-Speech-Synthesis-APIをフォローしています。

0 投票する
0 に答える
239 参照

javascript - Web Speech API にはランタイム制限がありますか

私は自分の環境でこれをテストしましたが、ここのGoogleの例で症状を見ることができます

音声をディクテーションすると、結果が 1 ~ 2 分ほど返されます。その後、それ以上のonresultイベントは到着しません。検出可能なエラーは発生しておらず、onendイベントはまだ発生していません。
ディクテーションを停止して何らかのタイムアウトを待った場合にのみ、onendイベントが発生します。

連続ディクテーションを長時間実行するように認識を設定するにはどうすればよいですか?

繰り返しますが、これは Google の例hereで複製できるため、コードの特定の問題ではないと思います

0 投票する
1 に答える
579 参照

javascript - Web Speech API 数字のみ

話された数字を認識する必要がある Web アプリケーションを作成しています。JavaScript Web Speech API を使用しています。現時点では非常にうまく機能していますが、精度を向上させるために、認識を数字のみに制限したいと考えています。私が持っていた1つの考えは、文法を設定することですが、私の人生ではどうやって解決することはできません. この制限を行う方法を知っている人はいますか?

0 投票する
1 に答える
385 参照

javascript - JavaScript Web Speech API .speechstart() ではなく .start() を使用するのはいつですか?

Web Speech API を使用して、開始時にユーザーがボタンをクリックして音声録音を開始する Web アプリケーションを作成しようとしています。ユーザーが話すのをやめると自動的に停止するようにしようとしています。次に、Google Translate API を使用してユーザーの音声を翻訳したいと考えています。問題が発生している Web Speech 部分のコードを含めました。

0 投票する
1 に答える
376 参照

javascript - アクセス許可情報バーを繰り返さずに Web Speech API で認識を続行する方法は?

私はWeb Speech APIに少し困惑しています。つまり、認識を段階的に処理する方法がわかりませんでした。

3 つの入力があるとします。

そして、3 つの入力単語を認識し、認識ごとに次の入力にフォーカスを移したいと思います。存在するAPIを使用してこれは可能ですか? 私が見たチュートリアル (このようなもの) では、パーミッション バーを繰り返しクリックする必要があるようで、非常に面倒です。

ページ読み込みごとにマイクへのアクセスなどを設定する方法はありますか?