問題タブ [pocketsphinx-android]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ibm-mobilefirst - worklight 6.0.0.2 でマイクにアクセスするにはどうすればよいですか?
現在、ワークライトにインポートされたポケットフィンクスを使用して音声をテキストに変換するモバイル アプリを開発しています。mozilla だけでは問題なく動作しますが、他のブラウザやワークライトではマイクが認識されません。では、どうすればこれを回避できますか??
speech-recognition - ファイルなしでポケットフィンクス キーワード検索を構成する
メソッド addKeywordSearch が利用可能であることは知っています。ただし、ファイルの作成が必要です。私の場合、回避しようとしているアプリにオーバーヘッドが発生します。私はウェブサイトでドキュメントを見つけようとしていますが、非常に限られています。addKeyphraseSearch メソッドに各単語の制限を伝えるために使用する特定の形式はありますか?
わかりやすくするために、addKeywordSearch メソッドを使用して、次のようなファイルを作成する必要があります。
addKeyphraseSearch メソッドを使用する以外に、これら 3 つのコマンドを使用する方法はありますか? たとえば、 addKeyphraseSearch(SEARCH,"next\nprevious\ngo to step") のようなものがうまくいくと思っていましたが、そうではありません
speech-recognition - ポケットフィンクスが認識精度を低下させる前のノイズリダクション
騒がしい環境でのポケットフィンクスの認識精度を上げようとしています。ただし、ユーザーはさまざまな環境でアプリを使用する場合があります。したがって、ノイズを伴うトレーニングは私がやりたいことではありません。
私の質問は、ポケットフィンクスに音声信号を供給する前のノイズリダクションは、必然的に認識精度を低下させるのでしょうか?
はいの場合、ノイズ除去後に音声のどの機能を保持する必要がありますか? 現在、ノイズ リダクションを使用すると、WER が ~40% (自由形式の言語) から ~60% に上昇することがわかります。
追加するだけで、ノイズリダクションの後、スピーチは知覚的に良く聞こえます.
ここでの考え方は、ノイズ リダクションを有効にした場合の音声認識の精度の向上を実証することであり、直感的には、ノイズ リダクション アルゴリズムが信号のスペクトル コンテンツを完全に台無しにしない限り、これは理想的に起こるはずです。
どんな助けでも大歓迎です。
java - PocketSphinx Android デモ ランタイム例外
Pocket Sphinx demo のソースコードをダウンロードしました。実行しようとしていますが、ランタイム例外がスローされています。コードのログキャットを投稿しました。
c# - C# AccesViolationException で Pocketsphinx を呼び出す
pinvoke を使用して C# で pocketphinxチュートリアルを実行しようとしていますが、ps_decode_raw() を使用してデコードしようとすると AccessViolationException が発生します。
関数は次のようにラップされます
C の fopen もラップしました。これがチュートリアルを実装する最も簡単な方法だったからです。
ps で cmd_ln_retain を呼び出して、ps が問題の原因ではないことを確認してみました。(そうではありませんでした)。上記のデバッグコードも削除しました。
fopen に何か問題があることは確かですが、何が原因かはわかりません。
誰かがポケットフィンクスのログを要求しました. https://justpaste.it/h52t
android - CMUSphinx PocketSphinx - すべての (または大量の) 単語を認識する
PocketSphinx for Android を使おうとする前は、Google の音声認識 API を使用していました。検索名や辞書ファイルを設定する必要はありませんでした。言われたすべての単語を認識しました。
さて、PocketSphinx では、それを行う必要があります。しかし、私は 1 つの単語の認識を設定する方法しか見つけることができません. または辞書を設定する方法 (デモ プロジェクトで利用可能なものには単語がほとんどありません) は、認識エンジンがこれらの単語だけが存在すると考える. つまり、誰かが似たようなことを言った場合、認識機能は、辞書に載っている単語と認識します。
質問したいのですが、いくつかの検索名を設定するにはどうすればよいですか? または、利用可能なすべての単語 (または大量の単語) を認識するように設定するにはどうすればよいですか? 誰かが大量の単語を含む辞書ファイルを持っているのではないでしょうか?