タイトルとして、組み込みデバイスにpocketshpinxを搭載した音声認識システムに取り組んでいます。組み込みデバイスにpocketshpinxをインストールしていますが、取得音声時間が非常に遅く、認識結果が悪いです。アプリケーションの実行中、取得音声時間はcompute_frame_powに約5000nsかかりますが、それは必要ですか?計算速度を改善するにはどうすればよいですか?
1 に答える
ポケットフィンクスの内部には、非常に高速で実行するために多くのアルゴリズムが実装されています。デフォルトで有効になっているものもあれば、有効にする必要があるものもあります。実際にそれについてのwikiページがあります:
http://cmusphinx.sourceforge.net/wiki/pocketsphinxhandhelds
ただし、速度の最適化は複雑なプロセスであることに注意する必要があります。多くの場合、速度は精度と引き換えに得られるため、十分に注意する必要があります。精度自体も問題です。次のことをお勧めします。
適切な音響モデルを使用していること、およびデコーダーを適切に使用していることを確認してください。間違ったセットアップで精度を落とすのは非常に簡単です。その後、最適化は意味がありません。専門家の助けが必要な場合は、セットアップとテストをフォーラムで共有するか、直接開発者 (私) と共有できます。
テスト データベースをセットアップして、現在の精度と速度を追跡します。プロセスに沿ってパフォーマンスを追跡します。
アプリケーションをプロファイリングして、どのコンポーネントが最も時間がかかるかを理解する
アルゴリズムを有効にしてそのコンポーネントを高速化し、速度がどのように向上するかを確認します。