問題タブ [voice-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
voice-recognition - ジュリアスによる音声認識。.vocaファイルの作り方は?
私は音声認識システムを作っていますが、ジュリアスはこの作品で悪くない結果を示しています。サンプルの.vocaファイルの単語は完全に認識されていますが、ファイルに独自の単語と文字起こしを配置するにはどうすればよいですか?
前回のリリースでVoxForge( http://www.voxforge.org/ )を試し、その語彙を使用して音響モデルのナイトリービルドを試しましたが、ジュリアスの開始時に次のように多くのエラーが発生しました。
.vocaファイルの単語転記のルールを知っている人はいますか?
voice-recognition - 翻訳機能付きアプリ
音声認識翻訳機を必要とするアプリのアイデアがあります。いくつかの選択された言語で話すことができ、アプリがそれを画面上の英語のテキストに翻訳できるようにしたいと考えています。このようなアプリがすでに存在することは知っていますが、私のものには特別な優位性があり、利益を上げています。
基本的に私の質問は...どうすれば翻訳者のコーディングを取得できますか? オープンソースのものはありますか?ライセンス料を支払うことができる既存のものはありますか? ゼロから構築するためにお金を払わずに音声翻訳者を入手する最良の方法は何ですか?
voice-recognition - アプリ用の音声通訳者と翻訳者が必要です...どこに行けばいいですか?
アプリで使用できる音声通訳者と翻訳者をどこで見つけることができるか知っている人はいますか? テキストに翻訳されるいくつかの言語での音声認識が必要です。これはどこで見つけることができますか、またはどこから始めればよいですか? 私は新人なので、助けていただければ幸いです。
android - android.speech.RecognizerIntent APIを呼び出すと、接続エラーダイアログが表示され、ログに「calling_package」警告が表示されます
ユーザーの言語設定に依存するのではなく、ボタンを使用して音声検索を使用する言語をユーザーが選択できるようにする小さなアプリを作成しました(UI全体を日本語に切り替えずに日本語で音声検索したい場合があります)。
HTC Desire / Android 2.1(Softbank-x06ht)でアプリをテストしています。ただし、音声APIを呼び出すと、[接続に失敗しました]ダイアログボックス[再試行/キャンセル]が表示され、LogCatに次の警告が表示されます。
Google音声検索アプリを使用でき、問題なく動作することに注意してください。
API Docs http://developer.android.com/reference/android/speech/RecognizerIntent.html#EXTRA_CALLING_PACKAGEによると、開発者はcalling_packageパラメーターを使用しません。そうだとすれば、なぜログに欠落していると表示されるのでしょうか。
自分でパラメータを提供しようとしましたが、結果はまったく変わりませんでした。
android - Android の新しい「Listen To」アクションの開発
時間の許す限り、DAAP や UPnP などのプロトコルを使用して個人の音楽コレクションから音楽をストリーミングする Android 用アプリケーションの開発を完了しています。
私の質問は次のとおりです。アプリが Android の新しい「Listen To」音声コマンドに応答できるようにするにはどうすればよいですか?
あちこち探しましたがわかりません。
放送受信機だと思いますが、私の人生では、どれを見つけることができません。
どんな助けでも大歓迎です。
sms - Twilio、Tropo - SMS および音声アプリの他のユーザーは?
これまでのところ、SMS と音声アプリを支援するサービスとして Twilio と Tropo を見つけました。
他にもありますか?
私は主にリアルタイムの音声認識に関心があります (つまり、ユーザーが何かを話すことができ、システムはそれに基づいて応答できます)。
また、音声認識の品質がどのようなものか知っている人がいれば助かります!
web-applications - Web アプリからの音声をどのように認識しますか
1 つの単語 (「UNO !」) を識別するための非常に単純なものが必要です。
android - 'onCreate'メソッドで呼び出されたAndroid音声認識アクティビティにより、アプリの読み込みが遅くなります
私のAndroidアプリでは、スタートアップアクティビティのonCreateメソッドで音声認識を呼び出します。音声コントロールで起動するかどうかを優先しました。ただし、音声認識がオンの場合、アプリの読み込みには約5〜7秒かかります。オフにすると、アプリはほぼ瞬時に起動します。以下はサンプルコードです。Free_Form、max_results 1、およびカスタムプロンプトを追加しました。
だから本当に私は2つの質問があります:
startActivity(intent)は別のスレッドで実行されませんか?
通常のAndroid音声認識を呼び出すと、OnCreateメソッドの読み込みに非常に時間がかかるのはなぜですか?
android - Android 2.2.1 Nexus one:音声認識の問題
こんにちはフォークス、
ファームウェアを搭載したGoogleNexus1台の電話での音声認識に奇妙な問題があります:2.2.1。音声認識では、話された単語の複数の解釈が得られます音声認識に「こんにちは」と話すと、受信した結果は「こんにちは、ホテル、 「こんにちは」だけが来ると予想される写真、fomdem、honda」同じことがファームウェア2.1でも正常に機能し、満足のいく結果が得られます。
この問題を回避するには、何をする必要がありますか。提案は役に立ちます。
よろしく、Vinayak
android - Androidでの音声アクティビティの検出
既存の音声認識と同様に動作するアプリケーションを作成していますが、音声データを独自のWebサービスに送信して、音声認識部分を実行します。音声認識に最適な標準のMediaRecord(AMR-NBエンコード)を使用しています。これによって提供される唯一のデータは、getMaxAmplitude()メソッドを介したAmplitudeです。
人が話し始めたときを検出して、人が約2秒間話しなくなったときに、音声データをWebサービスに送信できるようにしようとしています。現在、振幅のしきい値を使用しています。振幅が値(つまり、1500)を超えると、その人が話していると想定します。私の懸念は、振幅レベルがデバイス(つまり、Nexus One v Droid)によって異なる可能性があることです。そのため、振幅値から導き出すことができる、これに対するより標準的なアプローチを探しています。
PS私はグラフ化-振幅を見ましたが、それは振幅だけでそれを行う方法を提供していません。