https://stackoverflow.com/a/8699337/519995で説明されているように、VoxForge 0.4英語音響モデルをセットアップしようとしています(ただし、XMLではなくRaw構成に適合しています)。VoxForge に切り替えたとき、エラー率が100%になりました。
入力音とはまったく似ていない結果が得られます。
何か間違った設定をしたと思いますが、何が原因かわかりません。
以下は、私が行った変更です (RawHelloNGram.java デモから開始)。
が false の場合VOX_FORGE
はすべて正常に機能し、true の場合はすべてが認識されません。
this.modelLoader = new Sphinx3Loader(
VOX_FORGE ?
"file:"+PROJECT_DIR+"/voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000"
: "resource:/WSJ_8gau_13dCep_16k_40mel_130Hz_6800Hz",
"mdef",
"",
logMath,
unitManager,
0.0f,
1e-7f,
0.0001f,
true);
this.model = new TiedStateAcousticModel(modelLoader, unitManager, true);
// changed parameters of mel-Filter
this.melFilterBank = new MelFrequencyFilterBank(
VOX_FORGE ? 200.0 : 130.0, // minFreq,
VOX_FORGE ? 3500.0 : 6800.0, // maxFreq,
VOX_FORGE ? 31 : 40 // numberFilters
);
if (VOX_FORGE) {
this.featureTransform = new FeatureTransform(
modelLoader
);
}
...
... later at the end of the pipeline setup
if (VOX_FORGE) {
pipeline.add(featureTransform);
}
完全を期すために、これは私が使用している構成全体です: https://gist.github.com/Iftahh/7336283