問題タブ [voice-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - .NETでの音声認識
.NETで音声認識を実装するにはどうすればよいですか?
私は.mp3
比較的高品質のコンピューター生成音声を備えたたくさんのを持っています。それぞれ.mp3
の声で、いくつかのランダムなテキストと、英語で6〜7桁のシーケンスを言います。それらの数字をテキストとして抽出したいと思います。
そのようなことを.NETに実装することは可能ですか?
android - Androidの音声認識はどのように機能しますか?
Androidの音声認識がどのように機能するか知りたいですか?音声認識に使用するライブラリはどれですか?デバイス/モバイル自体で音声認識プロセスを実行しますか、それともすべての音声をGoogleサーバーに送信し、応答してテキストを受信しますか?
ありがとう、サニー。
android - 音声認識とローカリゼーション?
Java音声認識とローカリゼーションの経験がある人はいますか?
基本的な音声認識オプションを備えたAndroidアプリケーションを構築することを考えていますが、翻訳ツール(おそらくGoogle翻訳)に基づいてローカリゼーションを実装したいと考えています。ユーザーはリモート辞書から新しい言語で彼の「辞書」を更新できます。 ..このプロジェクトは最初のフェーズであり、私はまだブレインストーミングを行っています。誰かが何らかの経験を持っているか、そのようなことさえ可能ですか?
speech-recognition - 組み込みアプリケーション用の音声認識エンジン
WindowsCE音声対応アプリケーションを開発するために利用可能な音声認識エンジンとSDKを調査しようとしています。私はニュアンスに出くわしましたが、他には何も見えません。可能であれば.NetSDKを使用したいと思いますが、ほとんどはC /C++だと思います。何か提案をいただければ幸いです。ありがとう。
keyboard - キーボードを音声制御に置き換える
私はキーボードを使うのにうんざりしています。
Dragon Naturally Speakingなどのツールを使用して、コンピューターの音声制御に成功した人はいますか?コーディングタスクとIDEの制御についてはどうですか?それに特有の問題はありますか?
android - 録音されたサウンドクリップを使用したアンドロイドの音声認識?
Android の音声認識機能を使用しましたが、気に入っています。これは、お客様から最も高く評価されている機能の 1 つです。ただし、形式には多少制限があります。認識エンジンの意図を呼び出し、文字起こしのために録音を Google に送信させ、テキストが返されるのを待つ必要があります。
私のアイデアの中には、アプリ内でオーディオを録音し、そのクリップを Google に送信して文字起こしする必要があるものがあります。
オーディオ クリップを送信して、音声をテキストに変換する方法はありますか?
android - 音声認識接続エラー
私は、 http://developer.android.com/resources/samples/ApiDemos/src/com/example/android/apis/app/VoiceRecognitionの VoiceRecognition.java の例に基づいて、音声認識の例を試してテストしようとしています。 .html
しかし、ボタンをクリックしてアクティビティを作成すると、接続の問題を示すダイアログが表示されます。私のマニフェスト ファイルは Internet Permission を使用しており、それが Google サーバーに渡されることを理解しています。これを使用するには、他に何かする必要がありますか。以下のコード
更新 2: Steve のおかげで、USB ドライバーをインストールし、Droid でアプリを直接デバッグすることができました。マイク ボタンをクリックしたときの LogCat 出力は次のとおりです。
気になる行は、calling-package パラメーターが欠落しているという警告です。
更新: OK、エミュレータのイメージを HTC の Google Voice Search に付属しているように見えるイメージに置き換えることができましたが、エミュレータから実行すると、Speak Again または Cancel ボタンを含む Audio Problem メッセージが表示されます。onActivityResult() に戻ったように見えますが、resultCode は 0 です。
LogCat の出力は次のとおりです。
ドロイドで接続の問題が発生する理由はまだわかりません。音声検索は問題なく使えます。また、いくつかの投稿で説明されているように、キャッシュとデータをクリアしようとしましたが、それでも機能しませんか??
windows-mobile - Windows Mobile - 音声制御 + 音声合成 (テキスト読み上げ)
Windows Mobile 6.5 アプリケーションがあり、簡単な音声制御 (「はい」と「いいえ」コマンドの認識など) を追加する必要があります。また、LCD に表示されるテキストを読み取る可能性を追加したいと思います。
このような問題の可能な解決策についての提案をいただければ幸いです。説明されている機能を備えた無料のライブラリはありますか?
助けてくれてありがとう、MatheW
c++ - 音声認識を使用するプログラムを作成しています...どこから始めればよいですか?
私は現在、Arduino コード (c/c++ ベース) とフラッシュ AS3 に手を出している設計学生です。私がやりたいことは、音声制御入力を使用してプログラムを作成できるようにすることです。
そのため、プログラムはユーザーに単語のスペルを求めます。ユーザーが単語をスペルアウトします。プログラムはこれが正しいかどうかを認識し、正しい場合はスコアに 1 を追加し、間違っている場合はユーザーを修正します。そのため、単語の大きなリストが表示され、それぞれの単語の音声ファイルが読み上げられ、音声認識部分が応答が入力と一致するかどうかを確認します。
理想的には、これを Arduino マイクロコントローラーとインターフェースして、モーターを使用した物理的な出力を反応で達成できるようにしたいと考えています。
このプログラムをフラッシュで作成できるか、Processing (arduino に関連付けられている) で作成できるか、または別の C プログラム作成プログラムが必要かどうかはわかりません。優れた音声認識プログラムをダウンロードする必要があると思いますが、これを他の何かとどのように連携させることができますか? また、私はMacを使用しています。(これが違いを生むかどうかはわかりません)
無知で申し訳ありませんが、ヒントは素晴らしいでしょう!
-スーザン
asterisk - スピーチの背景
みなさん、こんにちは。
アスタリスクの SpeechBackground アプリケーションを使用しました。バージョン 1.6.0.6 を使用しました。
次のようなエントリがあります。
SpeechBackground アプリケーションでどのファイルを指定すればよいかわかりません。アイデアを教えてください。/sounds ディレクトリからサウンド ファイルを指定しました。
's' を呼び出すと、呼び出しはすぐに解放されます。オーディオ サウンドが得られませんでした。誰か助けてください...