問題タブ [speech-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
1256 参照

usability - 使いやすさ:音声認識とキーパッド

ますます多くの音声認識が実装されており、優れた音声認識を行うライブラリが求められています。キーボードやキーパッドと比較して、その背後にある(使いやすさの観点からの)理論的根拠は何ですか?この開発に投資しなければならない理由は何ですか?

たとえば、コールセンターを見てみましょう。数年前、ほとんどすべてのコールセンターは、メニューのキーを要求するIVRを使用していました。現在、音声キーワードの入力やキーパッドの押下を伴うメニューがますます増えています。「請求書を言うか、1を押して請求書を表示してください」。または、会社の電話帳にも同じことが表示されています。「連絡しようとしている人の名前を言ってください」...「FranckLoyd」...「JackFreudと言いましたか?必要に応じて「はい」と言ってくださいこの人に連絡するか、「いいえ」と言って再試行してください。」

携帯電話を持たずに車に乗っているときはプラスだと思いますが、追加の待ち時間の価値はありますか?すべての選択肢に対する相互作用が長くなり、何かが言われたかどうかを分析しようとする際の迅速な時間が長くなりますか?また、信頼性は確かに以前よりも優れていますが、誰かがシステムに接続することを決めたおもちゃのように感じられることもあり、未来を感じることができます。

音声認識を使用した(または使用しないことを選択した)IVRまたはソフトウェアを設計した経験はありますか?

ありがとう!

0 投票する
5 に答える
3609 参照

speech-recognition - 「ボイストリガー」検出

「トリガーワード」を使用してオーディオの録音を開始する機能があれば、大幅に改善される音声アプリケーションがあります。完全な音声テキスト エンジンは必要ありません。トリガー ワードを確実かつ効率的に検出する機能だけが必要です。

この特定のユースケースをサポートする特殊な音声エンジン、またはそのような単一目的の検出エンジンを開発するためのライブラリ/方法があるかどうか疑問に思っています。理想的には、騒がしい環境で動作することを望みますが、1 人のユーザーの声に対してトレーニングすることもできます。

研究論文/トピックへのポインタも高く評価されるので、私は何を求めるべきかを知っています.

0 投票する
4 に答える
21900 参照

iphone - iPhone アプリ › 音声認識を追加しますか?

音声認識を使ったアプリを作りたいです。Google などの大企業がこの機能を実装しているのを見てきましたが、スタートアップ レベルで実装することに興味があります。誰かがこれを調べましたか?これを行うためのツールはありますか?

0 投票する
2 に答える
1107 参照

delphi - 音声認識がうまくいかない

Delphi(SAPI 5.3)による音声認識に関する記事をフォローしました。

http://edn.embarcadero.com/article/29583

基本的なアプリケーションを作成しました。しかし問題は、アプリケーションがすべて間違っていることです! 私が言っていることを正しく理解していません。たとえば、「単語」と言うと、「病棟」になります。等々。

誰でも私に与えることができる音声認識を行うためのより良い方法はありますか?

0 投票する
1 に答える
5297 参照

c# - マイクの代わりに音声ファイルからの音声認識

マイクの代わりにオーディオ ファイル (.mp3、wav) からの音声に対して音声認識を実行するにはどうすればよいですか?

C#.NET と Delphi からそれを実行できるようにしたいと考えています。

0 投票する
3 に答える
1945 参照

c# - C#の音声認識を使用する

カスタム(特殊)文法による音声認識をサポートするプログラムを作成しようとしています。ただし、SpeechRecognizedイベントは発生せず、音声認識アプレットは文法が存在しないかのように動作します。

これが私の正確な手順です。どこが悪いのか教えてください。

  1. コントロールパネルを開き、「音声」を検索して、「音声認識の開始」をクリックします。
  2. Visual C#を開き、新しいWindowsフォームプロジェクトを作成します
  3. このStackOverflowの質問の最初の回答のコードをコピーして、プロジェクトに貼り付けます。
  4. System.Speechに必要な参照を追加します。
  5. 音声認識アプレットを実行したまま、プログラムを実行します。
  6. 「聞き始めて」と言います。
  7. 1から100までの数字を言います。

ラベルのテキストがデフォルト値( "label1")から変更されることはないため、rec_SpeechRecognized()が呼び出されることはないようです。つまり、SpeechRecognizedイベントが発生することはありません。開いているウィンドウの名前やスタートメニューのプログラムの名前に少し似ているように聞こえる番号を言うと、それが私が意図したものであるかどうかを尋ねられます。先ほど定義したカスタム文法に完全にとらわれないようです。

私はウェブ上で見つけたたくさんの例を試しましたが、それらはすべて、私がリンクしたその回答の例とほとんど同じですが、文法が異なります。私はそれらすべてについて同じ結果を得るので、私は何か他のことをしているに違いないと思います。

私は何が間違っているのですか?

0 投票する
1 に答える
406 参照

flash - Flash から Adob​​e CS4 音声分析を使用する

Adobe Premiere は、話された言葉 (ビデオのオーディオ トラック) をテキストに書き起こすことができます。このモジュールをフラッシュまたはフレックスから使用することは可能ですか? Web アプリケーションを話し言葉で (Web カメラのマイクを使用して) 制御したいと考えています。

0 投票する
21 に答える
2178 参照

algorithm - なぜ音声認識が進んでいないのですか?

アルゴリズム設計者がそれに取り組むのに苦労している主題について、何がそれほど難しいのですか?

本当にそんなに複雑ですか?

このトピックがなぜそれほど問題になるのか理解するのに苦労しています。なぜこれが当てはまるのか、誰かが私に例を教えてもらえますか?

0 投票する
4 に答える
4261 参照

iphone - iPhone での音声認識

音声を認識し、その結果に基づいてさらにタスクを実行する iPhone アプリケーションを開発する必要があります。

iPhone 3.0 が音声認識をサポートしていないことはわかっているので、サーバー側に音声認識ソフトウェアを実装する必要があります。私はこのことだけを知っています。私は初心者なので、それに対処する方法がわかりません。

サーバー側で購入して実装する必要があるソフトウェアと、そのサービスの使用方法を意味します??

0 投票する
1 に答える
1145 参照

delphi - ファイルを入力とする音声認識

重複の可能性:
マイクではなく音声ファイルからの音声認識

ファイル (.wav または .mp3) を入力として使用し、Delphi を使用して音声認識を実行するにはどうすればよいですか?

マイクではなく音声ファイルを入力として使用したい。