0

アラビア文字を認識するモデルを作りたいです。言語モデルと辞書ファイルの作成方法は知っていますが、音響モデルで行き詰まっています。文字ごとにwavファイルを記録しているのですが、研修中、研修は継続しているのに研修時間が少なすぎるとのこと。使用しようとすると、モデルは何も認識しません(nullを与えます)。

wav ファイルをどのように録音すればよいか知りたいのですが、たとえば、 1 つの wav ファイルでAlifのような文字を 100 回繰り返す必要があるのか​​、それとも同じ文字の複数の wav ファイルを録音するだけなのかを知りたいのです。

あなたの助けは非常に高く評価されています。

4

1 に答える 1

1

wav ファイルをどのように録音すればよいか知りたいのですが、たとえば、1 つの wav ファイルで Alif のような文字を 100 回繰り返す必要があるのか​​、それとも同じ文字の複数の wav ファイルを録音する必要があるのか​​ を知りたいです。

文字ではなく、連語で複数のファイルを作成することをお勧めします。文字がわかりにくい。

使用しようとすると、モデルは何も認識しません(nullを与えます)。

ここには別の問題がある可能性があります (オーディオ形式が間違っているなど)。CMUSphinx フォーラムでデータベースをドロップボックスと共有して、この問題に関するヘルプを得ることができます。

于 2014-10-06T09:48:32.153 に答える