音声認識用の CMU ポケットフィンクスを調べています。理想的には、ライブオーディオを入力として使用して、オブジェクトの大きなリスト (〜200) である「ピックアップしてください」の行に沿って文構造を認識できるようにしたいと考えています。最初は、ポケットフィンクスを Ubunutu にインストールするのに非常に苦労しましたが、最終的には gstreamer を使用して動作させることができました。動作するようになったので、精度の向上に取り組んでいます。jsgf 文法を含めたいのですが、コードの説明や例が見つからず、現在途方に暮れています。
助けていただければ幸いです。