問題タブ [sphinx4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-to-text - Sphinx4 と es_MX_broadcast_cont_2500 の使用
私は現在、短いスペイン語 (MX) のインタビュー (長さ ~ 2 分) の音声トランスクリバーの開発に取り組んでいます。私はウェブでサーフィンをしてきましたが、これを見つけることができません。おそらく簡単すぎます:/ . .jar の実行中に、es_MX_broadcast... voxforge パッケージの /etc/h4.dict 内のアクセント付きのすべての単語に対してこの警告が表示されます (私は推測します)。転記やその他のエラーはまったくありません。
...
WARNING dictionary The dictionary is missing a phonetic transcription for the word 'kyrgyzst�'
'WARNING dictionary The dictionary is missing a phonetic transcription for the word 'explotaci�'
WARNING dictionary The dictionary is missing a phonetic transcription for the word 'inclu�'
...
私の手がかりは、テキスト エンコーダーに構成上の問題がある可能性がありますが、おそらく言語モデルを作成する必要があるということです。本当にトレーニングしたいのですが、まずそれを機能させる必要があります。これは、config.xml ファイルの linguist/dictionary/language_model/acoustic_model 部分です。
-------これは新しい情報です(2013年10月3日)----------
ありがとう、しかしそれは問題ではありません。ファイルはすでに UTF8 であり、JAVA TOOLS OPTION を UTF8 に設定しています。また、-Dfile.encoding を指定して .jar を実行し、何かを変更すると、同じリストが得られます。ファイルに別の辞書リストがあるかどうかを調べようとしたので奇妙ですが、私にはわかりません。h4.dict は大文字で、警告は小文字であり、警告リストに表示されないアクセント付きの単語もあるため、これは非常に奇妙なことです。より少ない単語で別の .dict ファイルを保存しようとしましたが、うまくいきませんでした。実際、警告にはより多くの単語が表示されました。
他のデモで使用されているような音響モデルに .jar を使用していないことが問題なのか、それとも転記やその他のエラーがまったくないという事実と関係があるのか はわかりません。
誰かが私を理解するのを手伝ってくれることを本当に願っています。その間、私はもっと一生懸命努力します.
事前に感謝します
matlab - MATLAB と SPhinx4 から生成された MFCC ファイルは異なりますか?
MATLAb を使用して .wav ファイルを .mfc ファイルに変換しました。同じことを行う MATLAB コードが 2 つ見つかりました。
http://www.ee.columbia.edu/~dpwe/resources/matlab/rastamat/
http://www.mathworks.in/matlabcentral/fileexchange/32849-htk-mfcc-matlab/content/mfcc/example.m
ただし、どちらも異なるMFCCSを提供しました。そのうちの 1 つは 20 行の mfc ファイルを提供し、もう 1 つは 13 行の mfc ファイルを提供していました。13 の MFCC 係数があると思いますが、13 行は 13 の係数を表していますか? また、2 つの Wave ファイルの MFCC を使用して、一方のサウンドが他方のサウンドでどのように発生したかを調べる必要がありました。しかし、結果は正しくありませんでした。助けてください。
java - Eclipse で Sphinx4 のプロジェクト ファイルを作成するにはどうすればよいですか?
ここからSphinx 4 ベータバージョン 3をダウンロードしましたが、Eclipse にインポートしようとすると、そのフォルダーに有効なプロジェクト ファイルがないと表示されます
このための有効なプロジェクト ファイルを作成するにはどうすればよいですか?
controls - ラップトップからの音声入力を使用したモーター制御
私の目的は、「進む」「戻る」などの音声入力を使用して制御することです。プログラミング部分には Sphinx 4 (JAVA) を使用したいと考えています。また、入力音声を与えるためにラップトップを使用する予定です。私は音声認識の研究はまったく初めてです。それで、いくつかの簡単な単語をキャプチャするために、どこから始めて、sphinx 4 のサンプル コードを提供するかを教えてもらえますか。
java - ライブラリがクラスパスにあるにもかかわらずSphinxクラスが見つかりませんか?
sphinx4-1.0beta6-bin.zipをダウンロードして、64 ビット Ubuntu 12.04 LTS にインストールしました。サンプルを実行できましたHelloWorld
。ただし、ここに示すように、独自のクラスを作成してConfiguration
オブジェクトを 作成すると、次のようになります。
エラーとしてフラグが立てられます。ライブラリに適切なjarがあり、ライブラリがビルドパスにあるにもかかわらず、 Eclipseはクラスをまったく見つけることができません。
ライブラリ内の jar は次のとおりです。
js.jar
jsapi.jar
sphinx4.jar
tags.jar
次に、なぜこのエラーが発生するのですか?
voice-recognition - このファイルは Sphinx トレーニングに適していますか?
私の WAVには、最初と最後に小さなブーンという音があります。このファイルは Sphinx トレーニングに適していますか? はいの場合、文字起こしファイルに特殊文字を含める必要がありますか?
ありがとうございます。よろしくお願いします。
speech-recognition - Sphinx-4 helloworld で logTotalScore と logAcoustic Score は正確に何を表していますか?
Sphinx-4のhelloworld.javaを少し改変して発音評価に使いたい。
このために、私は2つのことを知りたいです:
logTotalScore と logAcoustic Score は何を表していますか。(できれば例を挙げて説明してください。)
HelloWorld はどこでも HMM を使用しますか?