cmusphinx - 音響モデル時間数

Question

アラビア文字を認識するモデルを作りたいです。言語モデルと辞書ファイルの作成方法は知っていますが、音響モデルで行き詰まっています。文字ごとにwavファイルを記録しているのですが、研修中、研修は継続しているのに研修時間が少なすぎるとのこと。使用しようとすると、モデルは何も認識しません(nullを与えます)。

wav ファイルをどのように録音すればよいか知りたいのですが、たとえば、 1 つの wav ファイルでAlifのような文字を 100 回繰り返す必要があるのか、それとも同じ文字の複数の wav ファイルを録音するだけなのかを知りたいのです。

あなたの助けは非常に高く評価されています。

score 1 · Accepted Answer

wav ファイルをどのように録音すればよいか知りたいのですが、たとえば、1 つの wav ファイルで Alif のような文字を 100 回繰り返す必要があるのか、それとも同じ文字の複数の wav ファイルを録音する必要があるのかを知りたいです。

文字ではなく、連語で複数のファイルを作成することをお勧めします。文字がわかりにくい。

使用しようとすると、モデルは何も認識しません(nullを与えます)。

ここには別の問題がある可能性があります (オーディオ形式が間違っているなど)。CMUSphinx フォーラムでデータベースをドロップボックスと共有して、この問題に関するヘルプを得ることができます。

cmusphinx - 音響モデル 時間数

1 に答える 1

Related

Reference

cmusphinx - 音響モデル時間数