問題タブ [vosk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - WebSocketオンラインサーバーからVoskモデルを使用するには?
音声認識サービスを使用する Android アプリを開発していますが、Android デバイスには Google アプリがインストールされていません。そのため、音声認識には vosk API を使用していますが、音声認識の精度を高めるためです。より大きなサイズのモデルを使用する必要があります。これはアセットに多くのスペースを必要とします。では、アセットを含めたり、オンライン サーバーから直接使用したりせずに、どのように vosk モデルにアクセスできますか?
編集:-
vosk で Kaldi の WebSocket を見てきました。これは、オンライン サーバー ( https://github.com/just-ai/aimybox-android-sdk/tree/master/kaldi-speechkit#online-mode )から vosk を使用するのに役立ちますか? この中で、彼らは WebSocket の使用方法についての情報を提供し、例も示しましたが、WebSocket ファイルの作成については理解できません。
これに関するヘルプは役に立ちます!
speech-to-text - Javaで複数のvoskモデルを使用するには?
多言語を話す可能性のある場所で、アプリケーションで多言語の可用性をテストしたいと考えています。たとえば、日本に留学生がいる可能性のある学校で。アプリケーションはさまざまな言語を理解し、それらの言語で音声をテキストに変換する必要があります。
python-3.x - Discord フレンドの音声認識
音声認識プログラムを作りたいです。私は自分でコードを持っています。それらはインターネット上にたくさんあります。とにかく投稿します。
タスクは、私が不和でコミュニケーションをとる友人の音声認識と同時に音声認識を使用することです。マイクが別のプログラムで使用されている場合、speech_recognition ライブラリはエラーをスローするため、vosk ライブラリを使用しました。では、どうすればコンピューターでプログラムを実行し、オーディオ ストリームをディスコードからコンピューターに転送して、友人のスピーチが認識されるのでしょうか。これは可能ですか?