問題タブ [voice-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
grammar - vxml: インライン文法のヘルプが必要
vxml.org からいくつかのサンプル vxml スクリプトを見ています。スクリプトを呼び出すと、プロンプトが再生されますが、入力がまったく取得されません。話しかけると「入力なし」と返ってきます。ユーザーからの入力を示すタグが欠落している可能性があります。これは、Web サイトのサンプル スクリプトです。
誰にも手がかりがありますか?ティア
voice-recognition - vxml:音声プロンプトと列挙プロンプトを切り替えることはできますか?
私はTellMeに似たエンジンを搭載したvxmlを使用しています。音声メールシステムの電話プロンプトに音声認識を追加します。新しいメニューは、最初にユーザーに口頭での入力を求めます。一致するものが見つからない場合、または入力が与えられていない場合、ユーザーはタッチトーンオプションで再度プロンプトが表示されます。
元のメニューは次のようになります。
新しいメニューは次のようになります。
ただし、長いテキスト(長すぎてエラーが発生する)の代わりに、元のメニューの<enumerate>
and動作を使用して再プロンプトを表示したいと思います。<choice>
ここに質問があります:プロンプトの2番目のスタイル内でプロンプトの最初のスタイルを使用する方法はありますか?フィールドの中に入れてもいいですか?どうすればいいですか?
iphone - iPhoneの音声認識
音声認識は iPhone オーディオの一部ですか? iPhoneの音声認識のサンプルコードを作りたいです。どうやって始めるのか?アイデアを教えてください。音声認識プログラミングについて述べている iPhone アプリ開発者のドキュメントはありますか?
ありがとうございました、
voice-recognition - Android HTC Desire 音声入力の問題
2.1 を搭載しているのに Desire を搭載していないほぼすべての携帯電話でアプリが機能する理由について、誰かが考えているでしょうか?
私のアプリの 1 つは音声入力を使用しており、Desire は音声プロンプトが表示されたときに強制終了する唯一の電話です。
最悪の部分は、これをテストする方法がわからないことです。テストを持っていないか、テストしている人を知りません。
何か案は?
編集: HTC が Desire で音声を無効にしたことが最終的にわかりました。それをインストールするには回避策を講じる必要があります。
したがって、音声入力に依存している場合は、Google の例のコードを使用してエラーをキャッチしてください。
grammar - vxml:同等の入力で文法を定義する
私はTellMeベースのエンジンを使用しています。私は、ユーザーが同じと見なされるいくつかの異なることの1つを言うことができる文法の例を見てきました。ただし、私が見たすべての例は、インライン文法(使用しているvxmlエンジンでは機能しません)のものです。これを行うために.grxmlファイルを変更する方法を知りたいです。これはファイルです:
6つのアイテムではなく、3つのアイテムが必要です。各アイテムには2つの可能な発話があります。これをどのように行うことができるかについてのアイデアはありますか?
iphone - Objective-Cでの画像/音声認識
画像と音声認識を備えたアプリケーションを開発しています。これを行う方法についての情報源やアイデアはありますか?
ありがとう、ZaldzBugz
plugins - 音声認識機能を入手するにはどうすればよいですか
Unity ゲーム エンジンに音声認識機能を組み込むにはどうすればよいですか? 使用できるプラグインまたはフレームワーク (できればフリーウェア) はありますか? もしそうなら、それをインストールする方法についてのアイデアはありますか?また、ゲーム内のバックグラウンド ノイズがゲームへの音声入力に干渉すると、どの程度の問題が発生しますか? これを使用しているゲームの例はありますか? (Spain 3d のほか、Torque Game Engine 用)
c# - 音声認識: 音声駆動制御
数日前、B.tech 最終年度プロジェクトのプロジェクトのアイデアを求めました。
残念ながら、クールなアイデアは思いつきませんでした。
今、私は本当に私を喜ばせ、私をやる気にさせるアイデアを思いついた.
知的な人たちに聞きたいのですが、次のことは 5 か月で実現可能です。
プロジェクトのアイデアは次のとおりです。
「システムの音声駆動制御」
システムのユーザーの声を聞いて、音声指示でコマンドを実行するアプリケーションを作成したい:
最も単純な例は次のようになります。
メディア プレーヤーを開き、リストを再生し、曲を変更し、
他のアプリケーションを開く
一部のアプリケーションを閉じます
現在のウィンドウまたはアプリケーションを閉じる
可能であれば、実行時にもアプリケーションが新しいことを学習できるようにします。(第 1 フェーズの完了までに時間がない場合は、第 2 フェーズを計画)
これだけの例を実装できたとしても、次の学期も同じプロジェクトを続けなければならないので、今のところはこれで十分です。
プロジェクトの実現可能性を知りたい。また、このアプリを開発するのに最適な言語を教えてください。
また、すべての提案は大歓迎です。
iphone - iPhoneは音声でオーディオ録音を開始します
音量が特別なレベルに達すると、すでに「音声録音の開始」があります。ただし、欠点が 1 つあります。録音を開始すると、すでに 1/2 秒ほど逃しています。文章を話すと、最初の単語が失われます。
任意のアイデア (例が最適)。
最初にリスニングを開始し、ピークパワー、平均、ローパスを取得するとしましょう
録音するのに十分な大きさかどうか
値未満の場合は停止します
今のところ、平均ではなく、ピークパワーを聞くのが最善だとわかりました。しかし、それでも大丈夫ではありません。また、常に一時的な録音を行い、ピークが十分に高くなったら、今から 2 秒から開始することも考えました。そのようなものですが、ここでは実現する方法がわかりません。したがって、実用的な提案は大歓迎です。
ありがとうクリス
visual-c++ - VisualC++での音声フォームマッチング
Visual C ++の音声フォームマッチング/比較用のSDKはありますか?または、おそらく音を音声学に変換します。
使用法:プログラムは、作り上げられた外国語で与えられた特定のコマンドワードからの入力とは異なることを行います。(クリンゴン)
分析-ユーザーの音声と既存の録音済み音声セグメントとの比較
私が扱っている言語は広くサポートされていないため、既存のテキスト読み上げSDKを使用するのではなく、より一般的なバージョンを選択する必要があると思います。