問題タブ [sphinx4]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
3535 参照

java - sphinx4を使用してすべての英語の単語を認識する

sphinx4を使用してすべての英語の単語を認識するのに問題があります。文字「A」で始まるすべての英語の単語をJavaの文法ファイルに追加して実行しようとしました。初めて、最初に256m保持していたJavaヒープスペースのエラーが発生しました。それから512mに変更しました。今回はjavaからのエラーはありませんでしたが、認識機能は1つの単語を認識せず、間違った単語も認識していませんでした。すべての英語の単語を含む音声認識文法ファイルを作成するのを手伝ってくれる人はいますか...

これはここでの私の最初の質問なので、いくつかの良い結果を得ることを望んでいます。

0 投票する
1 に答える
1325 参照

mp3 - Sphinx 4 を使用した mp3 認識

wavファイルを使わずにmp3ファイルを音声認識処理に使用できますか? または、mp3 から wav ファイルを生成し、精度に深刻な影響を与えずに音声認識を実行できますか? 問題は、アプリケーションでネットワークを介して転送される負荷を最小限に抑える必要があることです。変換で失われる情報は、精度の大きな要因になりますか?

0 投票する
1 に答える
162 参照

noise-reduction - ノイズを「生の」ファイル(AN4データベース)にミックスする方法

ノイズリダクションの研究をしています。ノイズファイルとオーディオファイルをミックスする方法を教えてもらえますか?私はAN4データベースを使用しているので、それらはすべて「raw」形式です。前もって感謝します。

0 投票する
3 に答える
2632 参照

java - Java sphinx プログラムのエラー

こんにちは、音声ソフトウェアを開発したい Java でソフトウェアを作成しています... Java で「Hello」スフィンクス コードを実行しています。

このプログラムを実行しようとすると、このエラーが発生しました...

提案してください...

ありがとう

0 投票する
1 に答える
633 参照

java - マイクを使用して音声を 1 回録音できますが、2 回目はマイクを開始できません

CMU sphinx ライブラリを使用してサウンドを録音しています。Java アプリケーションを開始するとき、次のように Recognizer と Configuration Manager を 1 回だけ割り当てます。

さらに、アプリケーションにサウンド録音ボタンがあります。ユーザーがクリックすると、以下のコードを使用してサウンドを録音します。

これは私が初めて行うときに機能します。ただし、ユーザーが録音ボタンを 2 回クリックすると、「マイクを開始できません」というエラーがスローされます。ここで私が間違っていること。2回目にマイクを取得できないのはなぜですか

0 投票する
1 に答える
1309 参照

machine-learning - CMU Sphinx の信頼スコアを確率に変換する際のバイアス

CMU Sphinx のレコグナイザーの出力 (つまり、リスト < 仮説 (つまり、句)、スコア (対数) > test_ps_nbest.c を微調整して取得) を次の形式に変換しようとしています: リスト < 仮説 (つまり、句)、「確率」 (間0 と 1) >

私が現在使用している簡単な方法は次のとおりです。

  1. 各信頼スコアを言語の重みで割ります (例: 11)
  2. ログドメインの信頼スコアのリストを正規化します
  3. 出力確率 = exp(正規化された信頼スコア)

問題は、上記の方法からの出力確率が偏っていることです。確率の偏りを得るために使用できる提案はありますか?

バイアスを修正するために実装する必要があるメソッドの例:

vector < double > getBias(vector < string > phrases, vector < double > logConfidenceScores)

上記の説明の入力例:

< "HE GOT IN OUR HEAD HEART LUNG AND HE MARKED IT", -43278 >

< "彼は私たちのクラスでお金を手に入れ、それをマークしました", -43449 >

< 彼は心臓の肺に力を入れ、それをマークしました", -43368 >

0 投票する
1 に答える
1180 参照

sphinx4 - sphinx-4でのHTK音響モデルの使用

私は音声認識ツールとしてsphinx-4を使用してきましたが、まだツールを学習しようとしています。私はHTKを使用して開発されたアラビア語の音響モデルを持っています。Sphinx-4でこの音響モデルをどのように使用できるか知りたかったのです。

0 投票する
0 に答える
299 参照

android - テキストの代わりに音素を表示する [pocketsphinx]

Android デバイスで PocketSphinx の HelloWorld チュートリアルを正常にコンパイルしました。
[リンク: http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/]

ここで、HelloWorld チュートリアルのコードを微調整して、テキストではなく話し言葉の音素のみが画面に表示されるようにするために、助けが必要です。

0 投票する
1 に答える
257 参照

java - Java Sphinx の createRecognizer

javax.Speech.Recognizer クラスの Oracle ドキュメントを確認したところ、 createRecognizer メソッドを説明するこのステートメントが見つかりました。「指定された必須プロパティを持つRecognizerを作成します。必要なプロパティを持つ Recognizer がない場合、メソッドは null を返します。」ここで、認識機能がない場合はどういう意味ですか? ここで新しい認識機能を作成しませんか?

0 投票する
2 に答える
1541 参照

java - Sphinx 4をFreeswitchと統合し、通話音声を受信し、認識を行う方法

FreeswitchでIVRを設定するための実用的な知識があります。Sphinx 4をインストールしましたが、マイクからキャプチャされたスピーチに適しています。ただし、FSをSphinx4と統合したいと思います。

FSをSPHINXと統合するには、CairoなどのMRCPサーバーが必要であるとどこかで読んだことがあります。カイロのようなものは本当に必要ですか?FSにはPocketSphinxが付属していますが、Sphinx4を使用したいと思います。Sphinx4とFreeSwitchを統合する方法を教えてください。