問題タブ [pocketsphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
unicode - ポケットフィンクスのシンハラ語モデルの問題
シンハラ語の音声認識システムを作成しようとしています。私は言語モデルを作成しようとしましたが、Build NEW Acoustic model, Dictionary , Language model for uncommon language speechrecognition の回答に従いました。Windows でオンラインの lmtool と cmuclmtk-0.7-win32 の両方を使用しました。入力ファイルは次のとおりです。
lmtool と cmuclmtk に送信した後、次のような出力が得られました。
.dic ファイルと .lm ファイルの両方に上記の文字が含まれています。これらはゴミのキャラクターだと思います。これを得るために私は何を間違えましたか?
ubuntu - sphinx_fe コマンドで問題を作成する Pocketsphinx 音響モデル
現在、音響モデルの構築に問題があります。仮想ボックスでubuntu 14.04を使用して、ポケットフィンクスをテストし、sphinxtrainを使用して音響モデルをトレーニングしています。最初に .wav ファイルを .mfc に変換してから、「sphinxtrain run」コマンドを実行する必要がありますか? 次の手順を実行しました。
- 「sphinxtrain run」コマンドを実行します
- .wav を .mfc に変換するには、sphinx_fe -i Anuradha-eight.wav -o file.mfc -argfile etc/feat.paramsを実行します。
どちらの試行も失敗しました。出力ファイルとログ ファイルは、こちらで確認できます
python - Pocketsphinx Raspberry Pi で dmp ファイルの読み込み中にエラーが発生しました
Raspberry Pi 2 B で Python を使用して pocketphinx を使用しようとしています。
しかし、Decoder を作成して dmp ファイルを読み取ろうとすると、次のようにスローされます。
そして、プログラムが終了し、電話モデルでも試してみましたが、完全に機能しました! (ただし、認識は悪いです)。
何が問題になるか知っていますか?
cmusphinx - Pocketsphinx: -inmic yes のリアルタイム出力を .txt にキャプチャする
私は Windows で pocketphinx_continuous を使用しています。テキスト ファイルへの出力のリダイレクトは、"-infile" 引数で機能しますが、"-inmic yes" で失敗します。
質問で述べたように、ポケットフィンクスは標準出力をフラッシュしますか? pocketphinx は stdout を無視します (少なくとも -inmic を使用する場合)。
「-inmic yes」を指定して pocketphinx_continuous で認識された単語をテキスト ファイルに保存する方法はありますか。
具体的には、Java プログラムで pocketphinx_continuous.exe を実行し、マイク入力から単語を認識させたいと考えています。
解決
Alexander Solovets が提案したように-backtrace
withを使用すると、結果がログと共に指定されたファイルに保存されます。-logfn
ただし、ログは、結果が端末に送信されるほど頻繁には保存されません。結果をできるだけ早くファイルに出力したかったので、次の変更を加えてソースから pocketphinx_continuous.exe をビルドしましたcontinous.c
。
連続した.c:
speech-recognition - Sphinxtrain senone.c エラーと pocketphinx_continuous bin_mdef.c エラー
pocketphinx を使用してシンハラ語音声認識システムを構築していると、 sphinxtrain runコマンドと pocketphinx_continuousコマンドの実行中に 2 つの大きなエラーが発生しました。プロジェクト フォルダはHEREで確認できます。まだ小さなデータセットを使用しており、現在、さらにいくつかの単語を記録している最中です。sphinxtrain run コマンドを実行した後、フォルダーsiを作成して、次のファイルを pocketphinx 言語モデルのデフォルトの場所/usr/local/share/pocketsphinx/model/en-us/にコピーしました。
- mdef
- feat.params
- 混合重量
- 意味
- ノイズディクト
- 遷移行列
- 差異
- シンハラ語.dic
- シンハラ.lm
- シンハラ電話
次に、 pocketphinx_continuousコマンドを実行しました。取得したエラーはHEREです。
- シンハラ語の場合 電話の数を特に 255 未満に減らすのは非常に困難です。そのための解決策はありますか?
- ログに senone.c エラーが記録されるのはなぜですか? およびそれを修正する方法は?
- SRILM は、シンハラ語の .lm.bin ファイルの作成をサポートしていますか?
speech-recognition - ポケットフィンクスはスポッティング モードでどのようにキーワードを出力しますか
シェルに入りpocketsphinx_continuous -infile talk.wav -keyphrase "talk" -kws_threshold 1e-40
、最後にいくつかの数字を持つポケットスフィンクスによって生成された大きな出力を受け取りました。それが単語を見つけたかどうかをどのように見つけますか? 出力の最後の 2 行: