問題タブ [sphinx4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-recognition - Sphinx 4 は ARPA LM を破損しましたか?
SPHINX を実行すると、 kylmによって生成された ARPA LM があり、次の例外スタック トレースが表示されます。
ARPA LM の抜粋を次に示します。
PS :後に改行があります\end\
例外は、SPHINX が最後の行で予期しない EOF に遭遇していることを示しています (そこで EOF に遭遇するはずではありませんか??)
助けてください!
voice-recognition - Sphinx の言語モデルを作成するには、どのくらいのコーパスが必要ですか?
ドメインの適切な言語モデルを取得し、それを CMU Sphinx などの音声認識ツールで使用するために、処理する必要があるドキュメント、文、または単語の数を知りたいです。
speech-recognition - CMU の sphinx4 を使用して数字以外のデータを転記する
私は最近、書き起こしに CMU の sphinx4 を使用することに取り組んでおり、最終的に強制的に整列させます。つまり、音声をその書き起こしに合わせます。
基本的に私が開発したいことを実行するAutoCapというプロジェクトを見つけました。ということで、インストールしましたがダメでした。微調整してみましたが、取得したのは間違ったタイムスタンプだけでした。
そこで、sphinx4 を使って自分でやってみようと思いました。Sphinx の Transcriber.jar ファイルを使用して、wav ファイルの書き起こしに成功しました。しかし、数字以外のデータを含むオーディオでは機能しませんでした。readmeページには、「数字以外のデータを転記したい人は、正しい文法、言語モデル、および言語学者を使用して config.xml ファイルを変更する必要があります」と記載されています。
それで、誰でもこれらのいずれかについて私に助けを提供できますか:
- オートキャップ
- Sphinx4 を使用して数字以外のデータを転記する
- 強制整列
ありがとう。
java - jdb を使用したデバッグ
自分のやり方Sphinx 4
(Java の CMU 音声認識エンジン) を理解しようとして、ディストリビューションに含まれているデモを自分のやりたいように変更して使用しようとしました (デモの名前は ですAligner
)。jdb
問題が発生しており、コマンド ラインから同じ問題をデバッグするために使用したいと考えています。hereのドキュメントを読みましたが、制限があり、問題の解決策がありません。簡単に言えば次のとおりです。
jdb
私は次のように呼び出します:(
jdb Aligner
プロジェクトのメインクラスの名前)。次のようにブレークポイントを設定します:
stop at Aligner:33
私が得る出力 (コマンドラインで):
Deferring breakpoint Aligner:33.
It will be set after the class is loaded.ファイル
demo.xml
(このプロジェクトの makefile に相当するもの) には、
javac debug=true
が記載されています。
私の質問:
1. どこjdb
から呼び出せばよいですか? sphinx ディレクトリ全体のどこからでも呼び出す必要がありますか、それとも同じディレクトリから呼び出す必要がありAligner.java
ますか? 2.このプロジェクト で を
どのように使用できますか?jdb
jar
PS: これで Eclipse を使用できることはわかっていますが、その方法を知っているかどうかはわかりません。私の最優先事項は、これを稼働させることです。
PPS: 私は Java の初心者で、言語についてあまり知りません。コマンド ラインに対する私の好みは、コマンド ラインでの C/C++ プログラミングのバックグラウンドに由来しています。
どんな助けでも大歓迎です、
ありがとう!
java - 音声をテキストに変換するには?
sphinx4 を使用して wav ファイルをテキスト ファイルに変換しようとしています。文法ファイルに含まれていない単語を認識できますか?
speech-recognition - sphinx4では音声認識応答が悪い
現在、音声認識にsphinx4を使用することを検討しています。ディクテーションタイプのアプリケーションに対して、良好な応答を実現しようとしています。入力はwavファイルであり、それを転記したいと思います。Sphinx4が提供するLatticeDemoとTranscriberのデモを調べました。同じ構成を使用すると、応答がかなり悪くなります。設定ファイルを微調整しようとしましたが、単語が認識されません。提供されている転記者のデモは数字用です。単語を理解できるように構成ファイルを変更しました。しかし、何かが足りないのかどうかはわかりません。設定ファイルを添付しました。できる限りの改善を提案してください。
speech-recognition - 数字以外の認識にhtkを使用する
私は音声認識アプリケーションにsphinx4と組み合わせたHTkを使用しようとしています。私は入力をwavファイルとして提供しており、スフィンクスが提供する「Transcriberdemo」と「LatticeDemo」を使用していますが、出力はほとんど受け入れられませんでした。そこで、Sphinx4でHTKを導入することにしました。しかし、結果の出力は何マイルも離れているように見えます。私がやっていることよりも、構成をさらに微調整できると確信しています。私は、htkとsphinx4の使用に関連するチュートリアルがあるかどうかを調べるためによく検索しました。この素晴らしいブログ(http://nsh.nexiwave.com/2009/09/using-htk-models-in-sphinx4.html)を除けば、私は他に何も見つけていません。誰かが私の認識精度を向上させるためにここで私を助けてくれますか?
私の設定ファイルはsphinxです:
どんな助けでも本当にありがたいです
cmusphinx - CMU スフィンクスのドイツ語発音辞書
PocketSphinx / CMU Sphinx で使用するドイツ語の発音辞書を探しています。
辞書は次のようになります。
これらを英語で見つけるのは問題ありませんが、ドイツ語で見つけることができません。どこで見つけられるか分かりますか?
speech-recognition - Sphinx4を使用したディクテーションアプリケーション
質問は3歳になっているので、私の要件はこの質問に似ています。自分に固有の情報を使用して質問を再投稿しています。.wav(またはその他の標準オーディオファイル形式)を使用して変換するアプリケーションを作成したいと思います。テキストにそれ。
音声認識には、sphinx4を使用することにしました。これは、sphinxで提供されるTranscriberデモを強化しようとしています。それは良いですが、それは特定の文法(.gramおよび.gxmlファイルで書かれている)に対してのみ機能します。
編集 英語で使用できるようにするには?VoxForge_en_0.4で構成しようとしています。私のconfig.XMLファイルは次のようになります:-
私の設定に何か問題がありますか?Plzヘルプ...