問題タブ [sphinx4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
build - sphinx grammarLocation でリソースが見つかりません
ant を使用して JSGFDemo をビルドすると、すべて正常に動作します。JSGFDemo.jar ビルド アーティファクトを実行すると、エラーは発生しません。ただし、Eclipse にインポートされたソース フォルダーを使用し、lib/ ディレクトリ内の jar ファイルをビルド パスに追加すると、次のメッセージが表示されてプログラム エラーが発生します。
何らかの理由で、ConfigurationManagerUtils.class.getResource(resourceName);
inへの呼び出しはConfigurationManagerUtils.resourceToURL(String location)
、場所 = "resource:/edu/cmu/sphinx/demo/jsapi/jsgf/" に対して異なる結果を返すようです。(null、または有効な URL オブジェクト)
補足として、 getResource("/path/to/a/dir/not/file/"); と思いました。jar 内のパスに解決される場合は無効でした。
私はしばらくこれに頭を悩ませてきましたが、何が間違っているのかわかりません。
cmusphinx - スフィンクスで1回繰り返した後、マイクが起動しない
CMU sphinx ライブラリを使用していますが、1 回の反復を正常に実行した後、このエラーが表示されます。マイクを開始できません。ubuntu 12.10 の Eclipse で実行すると、コードはすべての反復で正常に動作します。Windows 7 で Eclipse を使用すると、このエラーが表示されるのはなぜですか?
cmusphinx - Sphinx 4.0 で次のエラーが発生する - 'helloLinguist' プロパティ:'grammar' - 必須プロパティが設定されていません
私は sphinx 4.0 レコグナイザーを使用しています。実行時に静的に定義された 2 つの文法を交換するためにアプリケーションを実行しているときに、eclipse で「 'helloLinguist' プロパティ:'文法' - 必須プロパティが設定されていません!」というエラーが発生します。リンクhttp://cmusphinx.sourceforge.net/wiki/sphinx4:swappinggrammarsで提供されている構成 xml ファイルを使用しています。助けてください。
speech-recognition - Sphinx 4: 短いポーズで発音された単語で wav を認識する
私は Sphinx 4 が初めてで、単純な数字認識アプリケーションを作成しようとしています。テスト用に、短いポーズで発音される 3 桁の wav のセット (one_five_nine.wav など) があります。問題は、最初の数字が見つかった後にファイルの認識が停止することです。そのため、one_five_nine.wav の出力として「1」しかありません。
これが私のフロントエンド設定です
とコード
ご協力ありがとう御座います。
java - 文法ファイルの解析中に Sphinx 字句エラーが発生しました
Java で音声認識プログラムを作成して、それがどのように機能するかを確認してきました。1日前まではすべて完全に正常に機能していました。コードを何も変更していないため、何が起こったのかわかりません。
字句エラーが発生しているので、文法ファイルを貼り付けるだけでよいと思います。
コントロールグラム:
エラーログ:
すべての空白文字を削除して、ANSI、UTF (BOM の有無にかかわらず) でエンコードしようとしました。どれも駄目でした…
誰でもここで私を助けることができますか?
noise - 最小許容認識精度を設定する方法は?
長い音声ファイル (wav) のキーワードを認識する必要があります。さまざまなノイズ、クリック音、カチャカチャ音などがあります。この音は、キーワードとして認識されることがよくあります。
単語を正しく区別するためのしきい値を設定するにはどうすればよいですか?
speech-recognition - Sphinx4 の構成マネージャーがルックアップから null を返す
このチュートリアルに従って、Sphinx4 と Java-Speech-API を使用して音声認識を作成しているときに問題が発生しました。著者がブログで行ったのとまったく同じことをしましたが、プログラムを実行すると NullPointerException を受け取ります
セキュリティ上の問題である可能性はありますか?それが1つの場合、どうすれば修正できますか?
助けてくれてありがとう、良い一日を。
nlp - ARPA 言語モデルのドキュメント
ARPA 言語モデル形式に関するドキュメントはどこにありますか?
ポケットスフィンクスSTTエンジンを使った簡単な音声認識アプリを開発しています。そこでは、パフォーマンス上の理由から ARPA が推奨されます。カスタム ニーズに合わせて言語モデルを調整するために、どの程度のことができるかを理解したいと考えています。
私が見つけたのは、いくつかの非常に簡単な ARPA 形式の説明だけです。
- http://kered.org/blog/2008-08-12/arpa-language-model-file-format/
- http://www.speech.sri.com/projects/srilm/manpages/ngram-format.5.html
- http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html
私は STT の初心者であり、これを理解するのに苦労しています (n-gram など...)。より詳細なドキュメントを探しています。ここのJSGF文法に関するドキュメントのようなもの: