1

私はCMUのPocketSphinxを使用して、Androidタブレットで音声認識を実行しようとしています。これを行うためのチュートリアルはここにあります。私の問題は、かなりのサイズの文法を使用すると、認識の実行が非常に遅くなることです。言語モデルを使用すると、優れた精度と速度を実現できるため、一時的な解決策は、文法から言語モデルを生成して使用することでした。
私の構成では、を設定し-bestpath = falseました。その後、私は物事をスピードアップする方法について途方に暮れています。
明確化:大きな文法は初期化に時間がかかることは理解していますが、それを使用して認識を実行するのに長い時間はかからないと思います。

Pocket Sphinxと文法の使用経験があり、経験や構成などを共有できる人はいますか?

4

1 に答える 1

1

ネットで入手できるチュートリアルに従って、1Ghz Android モバイルで pocketphinx を使用しました(Google 検索を行うだけです)。起動はかなり早かったのですが、2単語しか録音していなくても10秒ほど録音を止めると切れてしまいました。これは、デフォルトの「hub4」の事前に記録された文法を使用していました。

于 2012-11-10T07:34:02.273 に答える