“sphinx4”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

1175 参照

speech-recognition - Sphinx 4 は ARPA LM を破損しましたか?

SPHINX を実行すると、 kylmによって生成された ARPA LM があり、次の例外スタックトレースが表示されます。

ARPA LM の抜粋を次に示します。

PS :後に改行があります\end\

例外は、SPHINX が最後の行で予期しない EOF に遭遇していることを示しています (そこで EOF に遭遇するはずではありませんか??)

助けてください！

2011-02-28T14:03:23.590

0 投票する

2 に答える

646 参照

voice-recognition - Sphinx の言語モデルを作成するには、どのくらいのコーパスが必要ですか?

ドメインの適切な言語モデルを取得し、それを CMU Sphinx などの音声認識ツールで使用するために、処理する必要があるドキュメント、文、または単語の数を知りたいです。

voice-recognition sphinx4

2011-07-15T07:25:38.780

0 投票する

2 に答える

1614 参照

speech-recognition - CMU の sphinx4 を使用して数字以外のデータを転記する

私は最近、書き起こしに CMU の sphinx4 を使用することに取り組んでおり、最終的に強制的に整列させます。つまり、音声をその書き起こしに合わせます。

基本的に私が開発したいことを実行するAutoCapというプロジェクトを見つけました。ということで、インストールしましたがダメでした。微調整してみましたが、取得したのは間違ったタイムスタンプだけでした。

そこで、sphinx4 を使って自分でやってみようと思いました。Sphinx の Transcriber.jar ファイルを使用して、wav ファイルの書き起こしに成功しました。しかし、数字以外のデータを含むオーディオでは機能しませんでした。readmeページには、「数字以外のデータを転記したい人は、正しい文法、言語モデル、および言語学者を使用して config.xml ファイルを変更する必要があります」と記載されています。

それで、誰でもこれらのいずれかについて私に助けを提供できますか：

オートキャップ
Sphinx4 を使用して数字以外のデータを転記する
強制整列

ありがとう。

speech-recognition sphinx4 cmusphinx transcription

2011-08-11T12:03:50.247

0 投票する

1 に答える

531 参照

java - jdb を使用したデバッグ

自分のやり方Sphinx 4(Java の CMU 音声認識エンジン) を理解しようとして、ディストリビューションに含まれているデモを自分のやりたいように変更して使用しようとしました (デモの名前はですAligner)。jdb問題が発生しており、コマンドラインから同じ問題をデバッグするために使用したいと考えています。hereのドキュメントを読みましたが、制限があり、問題の解決策がありません。簡単に言えば次のとおりです。

jdb私は次のように呼び出します：（
jdb Aligner プロジェクトのメインクラスの名前）。
次のようにブレークポイントを設定します:stop at Aligner:33
私が得る出力 (コマンドラインで):
Deferring breakpoint Aligner:33. It will be set after the class is loaded.
ファイルdemo.xml(このプロジェクトの makefile に相当するもの) には、
javac debug=trueが記載されています。

私の質問:
1. どこjdbから呼び出せばよいですか? sphinx ディレクトリ全体のどこからでも呼び出す必要がありますか、それとも同じディレクトリから呼び出す必要がありAligner.javaますか? 2.このプロジェクトでを
どのように使用できますか?jdbjar

PS: これで Eclipse を使用できることはわかっていますが、その方法を知っているかどうかはわかりません。私の最優先事項は、これを稼働させることです。

PPS: 私は Java の初心者で、言語についてあまり知りません。コマンドラインに対する私の好みは、コマンドラインでの C/C++ プログラミングのバックグラウンドに由来しています。

どんな助けでも大歓迎です、
ありがとう！

java debugging jdb sphinx4

2011-09-06T11:42:34.303

0 投票する

1 に答える

1676 参照

java - 音声をテキストに変換するには？

sphinx4 を使用して wav ファイルをテキストファイルに変換しようとしています。文法ファイルに含まれていない単語を認識できますか?

java speech-to-text sphinx4

2011-09-13T13:24:59.540

0 投票する

2 に答える

5030 参照

speech-recognition - sphinx4では音声認識応答が悪い

現在、音声認識にsphinx4を使用することを検討しています。ディクテーションタイプのアプリケーションに対して、良好な応答を実現しようとしています。入力はwavファイルであり、それを転記したいと思います。Sphinx4が提供するLatticeDemoとTranscriberのデモを調べました。同じ構成を使用すると、応答がかなり悪くなります。設定ファイルを微調整しようとしましたが、単語が認識されません。提供されている転記者のデモは数字用です。単語を理解できるように構成ファイルを変更しました。しかし、何かが足りないのかどうかはわかりません。設定ファイルを添付しました。できる限りの改善を提案してください。

speech-recognition speech-to-text cmusphinx sphinx4

2011-09-14T05:16:28.677

0 投票する

1 に答える

718 参照

speech-recognition - 数字以外の認識にhtkを使用する

私は音声認識アプリケーションにsphinx4と組み合わせたHTkを使用しようとしています。私は入力をwavファイルとして提供しており、スフィンクスが提供する「Transcriberdemo」と「LatticeDemo」を使用していますが、出力はほとんど受け入れられませんでした。そこで、Sphinx4でHTKを導入することにしました。しかし、結果の出力は何マイルも離れているように見えます。私がやっていることよりも、構成をさらに微調整できると確信しています。私は、htkとsphinx4の使用に関連するチュートリアルがあるかどうかを調べるためによく検索しました。この素晴らしいブログ（http://nsh.nexiwave.com/2009/09/using-htk-models-in-sphinx4.html）を除けば、私は他に何も見つけていません。誰かが私の認識精度を向上させるためにここで私を助けてくれますか？

私の設定ファイルはsphinxです：

どんな助けでも本当にありがたいです

speech-recognition speech sphinx4 cmusphinx htk

2011-09-30T09:58:15.817

0 投票する

2 に答える

2841 参照

cmusphinx - CMU スフィンクスのドイツ語発音辞書

PocketSphinx / CMU Sphinx で使用するドイツ語の発音辞書を探しています。

辞書は次のようになります。

これらを英語で見つけるのは問題ありませんが、ドイツ語で見つけることができません。どこで見つけられるか分かりますか？

cmusphinx sphinx4

2011-12-08T15:21:47.593

0 投票する

2 に答える

2151 参照

speech-recognition - CMU Shinx、JSAPI、Google Speech API を使用した音声認識

音声認識は、私の現在のプロジェクトの多くの機能の 1 つであり、J2EE で開発される可能性が最も高いでしょう (選択が正当化されれば、他の言語も歓迎されます)。

GoogleとSOのリンクのほとんどは、上記の 3 つのオプション、Sphinx 4、JSAPI 直接、および Google Speech API (Google にサーバー呼び出しを行い、結果をテキストとして取得するよりも) を提案しています。

他に自由に利用できるオプションは何ですか? また、Sphinx-4 を使用する場合、一般的な英語を使用するための言語モデルを取得するにはどうすればよいですか?

speech-recognition speech-to-text cmusphinx sphinx4

2011-12-29T06:37:37.320

0 投票する

1 に答える

6162 参照

speech-recognition - Sphinx4を使用したディクテーションアプリケーション

質問は3歳になっているので、私の要件はこの質問に似ています。自分に固有の情報を使用して質問を再投稿しています。.wav（またはその他の標準オーディオファイル形式）を使用して変換するアプリケーションを作成したいと思います。テキストにそれ。

音声認識には、sphinx4を使用することにしました。これは、sphinxで提供されるTranscriberデモを強化しようとしています。それは良いですが、それは特定の文法（.gramおよび.gxmlファイルで書かれている）に対してのみ機能します。

編集英語で使用できるようにするには？VoxForge_en_0.4で構成しようとしています。私のconfig.XMLファイルは次のようになります：-

私の設定に何か問題がありますか？Plzヘルプ...

speech-recognition cmusphinx sphinx4

2012-01-04T13:07:22.880

問題タブ [sphinx4]

Reference