問題タブ [speech-to-text]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-recognition - シンプルな音声テキスト変換ソフトウェアが必要
単語や文字の入力に使用できる解決策を見つけるのを手伝ってもらえますか? Java ベースのオープン ソース ソリューションを探しています。
文字を単に「 a A b B 1 8 」のように入力するか、単語を Apple php などのように入力するアプリケーションを探していました...
スリー
android - 音声認識機能が見つかりません
ユーザーの声を録音してテキストに変換するアプリを作成しています。この投稿からStackoverflowの投稿私はAndroid開発者のソースコードを見つけました。コードを実行しましたが、ボタンのテキストには「RECOGNIZERNOTPRESENT」と表示されています。以前にテキスト読み上げコンバーターを作成しましたが、正常に機能していたため、いくつかの権限が不足しているに違いないと思います。
何が問題になるのか、何か考えはありますか?
java - wavファイルJavaからのテキストへの音声
Java から wav ファイルを認識することは可能ですか? cloudgarden Java 音声 API で可能ですか?それらは cloudgarden の例のサンプル コードです。独自の wav ファイルに変更が必要な場合は、サンプル コードを以下に示します。
android-emulator - Android 2.2: エミュレーターの音声入力のオプションはどこにありますか?
私の Nexus One には次の機能があります。
- 設定には、「音声入出力設定」の一覧に「音声認識設定」があります。
- Google 検索の横にはマイク ボタンがあるので、それに触れるとダイアログが表示され、検索したい内容を言うように求められます。
ただし、エミュレーター (API レベル 8、Android 2.2) では、上記のいずれも見つかりません。
音声検索は Android 2.2 の一部ではありませんか? もしそうなら、なぜ私のNexus One (Froyo)にはあるのにエミュレーターには無いのですか?
少なくとも「音声入出力設定」を利用できるようにするにはどうすればよいですか?
更新 1 : 以下に示すように、レコグナイザー対応の AVD を作成する手順に従いましたが、「レコグナイザーが存在しません」というメッセージが引き続き表示されます。
他に何をする必要がありますか?
Google Inc. による Google API、Android API 8、リビジョン 2 をインストールし、それを使用して特別な AVD を作成しても、Android マーケットから音声検索アプリをインストールする必要がある可能性はありますか?
更新 2 : Michael の修正に従って、Google の音声検索アプリをインストールしました。これにより、「レコグナイザーが存在しない」問題は解決しましたが、新しい問題が発生しました。
アプリの提案「もう一度話してください」は偽物です。もう一度話すと、同じエラー メッセージが何度も表示されます。
c# - 優れた音声認識API
私は音声認識を使用している大学のプロジェクトに取り組んでいます。現在、Windows 7で開発しており、.netに付属のsystem.speech APIパッケージを使用しており、C#で開発しています。
私が直面している問題は、ディクテーション認識が十分に正確ではないことです。その後、アプリケーションを起動するたびに、デスクトップの音声認識が自動的に開始されます。これは私にとって大きな迷惑です。すでに私が話す言葉は十分に明確ではなく、矛盾する認識はコマンドとして解釈され、アプリケーションの切り替えの最小化などのアクションが実行されています。
これは私のアプリの重要な部分であり、このMicrosoftの失敗以外に、私に適した音声APIを提案してください。簡単なディクテーション文法だけでも理解できればいいですね。
c# - 音声認識の改善、C#
System.Speechライブラリを使用して音声を認識できますが、通常は非常に異なって認識されます。
どうすれば認識を改善できますか?文法クラスと関係がありますか?
android - Android の音声認識サービス
アクティビティで音声認識を使用する Android アプリケーションがあります。GUI は、音声認識オブジェクトを含める以外には何もしません。これをサービスに移植して、バックグラウンドで実行されているアプリケーションと通信できるようにしたいと考えています。
ただし、私の知る限り、音声認識サービスは onActivityResult を使用する必要があり、これはサービスでは使用できません。GUI が表示されないようにサービスにアクティビティを含めるか、アクティビティの代わりにサービスで音声認識を実行する方法はありますか?
android - Android用の生の「音声からテキストへ」の英語エンジンはありますか?
音声入力を英語の生のテキストに変換したいのですが、私の名前を「バブ・ソマスンダラム」と言うと、辞書にはありませんが、テキストを合成する必要があります。
また、この未来がAndroidまたは他のサードパーティAPIによってネイティブにサポートされていない場合、AndroidアプリからHTTPリクエストを作成できるようにするためのオンラインサービスはありますか?
前もって感謝します!
java - Android での音声合成
Speech to text を備えたアプリを作成しようとしています。
RecognizerIntent を使用したこの種の機能を認識しています: http://android-developers.blogspot.com/search/label/Speech%20Input
ただし、新しいインテントをポップアップさせたくありません。現在のアプリで特定のポイントを分析したいのですが、現在あなたの声を録音しようとしていることを示す何かをポップアップさせたくありません。
これを行う最善の方法について誰かアイデアがありますか。私はおそらくSphinx 4を試してみることを考えていました-しかし、これがAndroidで実行できるかどうかはわかりません-誰かアドバイスや経験がありますか?!
ここのコードを変更して、おそらく UI やボタンを表示するのを気にせず、単に処理を行うことができるかどうか疑問に思っていました: http://developer.android.com/resources/samples/ApiDemos/src/com/example/android/ apis/app/VoiceRecognition.html
乾杯、
c# - System.Speech を使用してオーディオ ファイルをテキストに変換する
16000 で Android フォンを介して記録された .wav ファイルを、C# を使用してテキストに変換しようとしています。つまり、System.Speech 名前空間です。私のコードは以下に記載されています。
は、サンプルの .wav "Hello world" ファイルで完全に機能しています。しかし、電話で何かを録音して PC に変換しようとすると、変換されたテキストは私が録音したものとはまったく異なります。音声ファイルが正確に書き起こされていることを確認する方法はありますか?