問題タブ [speech-to-text]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - Android用の生の「音声からテキストへ」の英語エンジンはありますか?
音声入力を英語の生のテキストに変換したいのですが、私の名前を「バブ・ソマスンダラム」と言うと、辞書にはありませんが、テキストを合成する必要があります。
また、この未来がAndroidまたは他のサードパーティAPIによってネイティブにサポートされていない場合、AndroidアプリからHTTPリクエストを作成できるようにするためのオンラインサービスはありますか?
前もって感謝します!
java - Android での音声合成
Speech to text を備えたアプリを作成しようとしています。
RecognizerIntent を使用したこの種の機能を認識しています: http://android-developers.blogspot.com/search/label/Speech%20Input
ただし、新しいインテントをポップアップさせたくありません。現在のアプリで特定のポイントを分析したいのですが、現在あなたの声を録音しようとしていることを示す何かをポップアップさせたくありません。
これを行う最善の方法について誰かアイデアがありますか。私はおそらくSphinx 4を試してみることを考えていました-しかし、これがAndroidで実行できるかどうかはわかりません-誰かアドバイスや経験がありますか?!
ここのコードを変更して、おそらく UI やボタンを表示するのを気にせず、単に処理を行うことができるかどうか疑問に思っていました: http://developer.android.com/resources/samples/ApiDemos/src/com/example/android/ apis/app/VoiceRecognition.html
乾杯、
c# - System.Speech を使用してオーディオ ファイルをテキストに変換する
16000 で Android フォンを介して記録された .wav ファイルを、C# を使用してテキストに変換しようとしています。つまり、System.Speech 名前空間です。私のコードは以下に記載されています。
は、サンプルの .wav "Hello world" ファイルで完全に機能しています。しかし、電話で何かを録音して PC に変換しようとすると、変換されたテキストは私が録音したものとはまったく異なります。音声ファイルが正確に書き起こされていることを確認する方法はありますか?
java - Android SpeechRecognizer は、アプリケーションのメイン スレッドからのみ使用する必要があります
Android Speech API の一部を AndEngine ベースのゲームに統合しようとしています。
コードを BaseGame アクティビティ内に配置しましたが、実行時に次のエラーが表示されます。
05-06 23:51:28.955: エラー/AndroidRuntime(553): java.lang.RuntimeException: SpeechRecognizer は、アプリケーションのメイン スレッドからのみ使用する必要があります
アプリケーションのメイン スレッドにアクセスするにはどうすればよいですか? また、Speech コードがその中で確実に実行されるようにするにはどうすればよいでしょうか。
セットアップは次のとおりです。
メイン クラス - BaseGameActivity SpeechClass
メイン クラスが新しい SpeechClass をインスタンス化し、そのメソッドを呼び出すと、上記のエラーが発生します。
これを正しく行う方法についてアドバイスしてください。
c# - C#での音声認識
私は音声認識を含むプロジェクトを行っています。しかし、ここでは単純なコマンドを認識する必要はありません。長い文を識別するためのアプリケーションが必要です。「私の名前はジャックです。イギリスに住んでいます」など。現在、MicrosoftSAPI5.1を使用しています。しかし、アプリケーションを実行すると、私が言っていることが正確に反映されません。
誰かが私にこれを成し遂げるためのより良いオプションを与えることができますか?私が言っていることをキャプチャし、それをテキストに変換する必要があります。助けてください
speech-recognition - Text-to-speech (音声生成) および speech-to-text (音声認識) API?
デスクトップまたはブラウザ環境向けの既知の API の包括的なリストはありますか?
text-to-speech - Linux > Python > TTS、STT、音声認識
テキスト読み上げ
Linux環境だけでなくWindowsでもpyttsxを実行しようとしていました...
Linux 環境:
Python は、最初の行を実行した後にハングアップします。対話型シェル プロンプトで両方の行を実行して、上記のステートメントを確認しました。
Windows 環境:
完全に実行され、pyttsx 1.0 win32.exe (ここから) と Windows の verisn 用のpywin (ここから)をインストールした後、目的の出力が得られます。
実際、私が実際に欠けているLinuxバージョンでは???
Speech to Text および音声の再植民地化
では、pyttsx は両方のタスクを実行できますか? そうでない場合は、効率的なライブラリを提案してください..
c# - スピーチからテキストへのWindowsの自動ハンドラーを無効にして、私が言うことを書きます
.NET 音声テキスト変換ライブラリ (SpeechRecognizer) の使用を開始しました
このサイトをグーグルで検索しているときに、次のコードサンプルを見つけました。
それは私が始めるのを助けました。この2行を変更しました
私の必要に
しかし、「閉じる」と言うと、Windows の音声認識エンジンがアプリケーションを閉じてしまいます!
さらに、自分の辞書を作成するよりも音声認識に適した方法はありますか? ユーザーに「自分自身にメモを書いて」のように言ってもらいたいと思います。ユーザーが話し、私が書きます。
同じ質問で 2 つの質問をして申し訳ありません。どちらも私の 1 つの問題に関連しているようです。
c# - C# を使用したテキスト読み上げ
C# 言語を使用してテキスト エディターを設計し、通常のファイル機能の音声認識を実装しようとしていますが、これを実装することは可能ですか。前回の質問と重複してしまい大変申し訳ありません。C# を使用して音声をテキストに変換する方法があるかどうかを知りたいだけです。あなたの助けは本当に貴重です。応答を待っています。前もって感謝します。
iphone - インターネットなしのiPhoneでの大語彙音声認識?
辞書が必要なOpenearsを使用しました。辞書に載っている単語に言及するときに便利です。私たちが話すすべての言葉を変換したかったのです。そこでNuanceの音声認識dragaon SDKを使いました。ただし、Webサーバーと通信します。セキュリティ上の理由から、サーバーとの通信を避けたいと考えています。オフライン モードでのみサーバーと通信せずに、Windows Mobile で話すすべての単語の音声をテキストに変換することは可能ですか?