アラビア文字を認識するモデルを作りたいです。言語モデルと辞書ファイルの作成方法は知っていますが、音響モデルで行き詰まっています。文字ごとにwavファイルを記録しているのですが、研修中、研修は継続しているのに研修時間が少なすぎるとのこと。使用しようとすると、モデルは何も認識しません(nullを与えます)。
wav ファイルをどのように録音すればよいか知りたいのですが、たとえば、 1 つの wav ファイルでAlifのような文字を 100 回繰り返す必要があるのか、それとも同じ文字の複数の wav ファイルを録音するだけなのかを知りたいのです。
あなたの助けは非常に高く評価されています。