問題タブ [speech-to-text]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
950 参照

java - AndroidSpeechToTextSTTダイアログ

AndroidでSpeechtoTextを使用しているときに表示されるダイアログボックスを非表示にする方法はありますか?私はそれが不可能なところを読んだことがありますが、少なくともそれを表示してすぐに非表示にする方法があるはずです。

何かをサブクラス化して外観を変更する方法はありますか?私のアプリでは、音声がエンコードされていることを示すインジケーターが必要ですが、Googleが標準で提供するダイアログボックスを使用していません。

0 投票する
1 に答える
1175 参照

speech-recognition - Sphinx 4 は ARPA LM を破損しましたか?

SPHINX を実行すると、 kylmによって生成された ARPA LM があり、次の例外スタック トレースが表示されます。

ARPA LM の抜粋を次に示します。

PS :後に改行があります\end\

例外は、SPHINX が最後の行で予期しない EOF に遭遇していることを示しています (そこで EOF に遭遇するはずではありませんか??)

助けてください!

0 投票する
2 に答える
1293 参照

speech-recognition - シンプルな音声テキスト変換ソフトウェアが必要

単語や文字の入力に使用できる解決策を見つけるのを手伝ってもらえますか? Java ベースのオープン ソース ソリューションを探しています。

文字を単に「 a A b B 1 8 」のように入力するか、単語を Apple php などのように入力するアプリケーションを探していました...

スリー

0 投票する
1 に答える
5048 参照

android - 音声認識機能が見つかりません

ユーザーの声を録音してテキストに変換するアプリを作成しています。この投稿からStackoverflowの投稿私はAndroid開発者のソースコードを見つけました。コードを実行しましたが、ボタンのテキストには「RECOGNIZERNOTPRESENT」と表示されています。以前にテキスト読み上げコンバーターを作成しましたが、正常に機能していたため、いくつかの権限が不足しているに違いないと思います。

何が問題になるのか、何か考えはありますか?

0 投票する
1 に答える
8904 参照

java - wavファイルJavaからのテキストへの音声

Java から wav ファイルを認識することは可能ですか? cloudgarden Java 音声 API で可能ですか?それらは cloudgarden の例のサンプル コードです。独自の wav ファイルに変更が必要な場合は、サンプル コードを以下に示します。

0 投票する
1 に答える
3799 参照

android-emulator - Android 2.2: エミュレーターの音声入力のオプションはどこにありますか?

私の Nexus One には次の機能があります。

  1. 設定には、「音声入出力設定」の一覧に「音声認識設定」があります。
  2. Google 検索の横にはマイク ボタンがあるので、それに触れるとダイアログが表示され、検索したい内容を言うように求められます。

ただし、エミュレーター (API レベル 8、Android 2.2) では、上記のいずれも見つかりません。

音声検索は Android 2.2 の一部ではありませんか? もしそうなら、なぜ私のNexus One (Froyo)にはあるのにエミュレーターには無いのですか?

少なくとも「音声入出力設定」を利用できるようにするにはどうすればよいですか?

更新 1 : 以下に示すように、レコグナイザー対応の AVD を作成する手順に従いましたが、「レコグナイザーが存在しません」というメッセージが引き続き表示されます。

ここに画像の説明を入力

他に何をする必要がありますか?

Google Inc. による Google API、Android API 8、リビジョン 2 をインストールし、それを使用して特別な AVD を作成しても、Android マーケットから音声検索アプリをインストールする必要がある可能性はありますか?

更新 2 : Michael の修正に従って、Google の音声検索アプリをインストールしました。これにより、「レコグナイザーが存在しない」問題は解決しましたが、新しい問題が発生しました。

ここに画像の説明を入力

アプリの提案「もう一度話してください」は偽物です。もう一度話すと、同じエラー メッセージが何度も表示されます。

0 投票する
2 に答える
72344 参照

c# - 優れた音声認識API

私は音声認識を使用している大学のプロジェクトに取り組んでいます。現在、Windows 7で開発しており、.netに付属のsystem.speech APIパッケージを使用しており、C#で開発しています。

私が直面している問題は、ディクテーション認識が十分に正確ではないことです。その後、アプリケーションを起動するたびに、デスクトップの音声認識が自動的に開始されます。これは私にとって大きな迷惑です。すでに私が話す言葉は十分に明確ではなく、矛盾する認識はコマンドとして解釈され、アプリケーションの切り替えの最小化などのアクションが実行されています。

これは私のアプリの重要な部分であり、このMicrosoftの失敗以外に、私に適した音声APIを提案してください。簡単なディクテーション文法だけでも理解できればいいですね。

0 投票する
3 に答える
5083 参照

c# - 音声認識の改善、C#

System.Speechライブラリを使用して音声を認識できますが、通常は非常に異なって認識されます。

どうすれば認識を改善できますか?文法クラスと関係がありますか?

0 投票する
2 に答える
6299 参照

android - Android の音声認識サービス

アクティビティで音声認識を使用する Android アプリケーションがあります。GUI は、音声認識オブジェクトを含める以外には何もしません。これをサービスに移植して、バックグラウンドで実行されているアプリケーションと通信できるようにしたいと考えています。

ただし、私の知る限り、音声認識サービスは onActivityResult を使用する必要があり、これはサービスでは使用できません。GUI が表示されないようにサービスにアクティビティを含めるか、アクティビティの代わりにサービスで音声認識を実行する方法はありますか?