0

私は Linux で pocketphinx を使用しており、CMU チュートリアルのソース コードを使用しています。HUB4 辞書、言語モデル、音響モデルをアップロードしようとしています。

辞書と言語モデルをアップロードしたときは動作していましたが、音響モデルを使用しようとすると、次のエラーが発生しました。

情報: acmod.c(246): /home/mintea/programs/hub4/hub4opensrc.cd_continuous_8gau/feat.params から解析されたモデル固有の機能パラメーター FATAL_ERROR: "fe_sigproc.c"、405 行目: フィルターバンクの作成に失敗しました、周波数範囲一致していません。サンプルレート 8000.000000、FFT サイズ 512、lowerf 5734.375000 < freq -15.625000 > upperf 5078.125000。

私が使用しているコードのスニペットは次のとおりです。

self.pipeline = gst.parse_launch('gconfaudiosrc ! audioconvert ! audioresample '
                                     + '! vader name=vad auto-threshold=true '
                                     + '! pocketsphinx name=asr ! fakesink')

asr = self.pipeline.get_by_name('asr')
asr.connect('partial_result', self.asr_partial_result)
asr.connect('result', self.asr_result)
asr.set_property('hmm', '/home/mintea/programs/hub4/hub4opensrc.cd_continuous_8gau')
asr.set_property('lm', '/home/mintea/programs/hub4/language_model.arpaformat.DMP')
asr.set_property('dict', '/home/mintea/programs/hub4/cmudict.hub4.06d.dic')        
asr.set_property('configured', True)

gst.parse_launch 呼び出しに、オーディオ レートを変更するために構成するフラグがあると考えていますが、その方法がよくわかりません。助言がありますか?ありがとう!

4

1 に答える 1