私はCMUのPocketSphinxを使用して、Androidタブレットで音声認識を実行しようとしています。これを行うためのチュートリアルはここにあります。私の問題は、かなりのサイズの文法を使用すると、認識の実行が非常に遅くなることです。言語モデルを使用すると、優れた精度と速度を実現できるため、一時的な解決策は、文法から言語モデルを生成して使用することでした。
私の構成では、を設定し-bestpath = false
ました。その後、私は物事をスピードアップする方法について途方に暮れています。
明確化:大きな文法は初期化に時間がかかることは理解していますが、それを使用して認識を実行するのに長い時間はかからないと思います。
Pocket Sphinxと文法の使用経験があり、経験や構成などを共有できる人はいますか?