私は Sphinx-4 を使用して音声をテキストに変換していますが、アプリケーションが文法を認識してから、口述された一連の単語を認識する必要があります。
たとえば、次の文法があります。
public <greet> = (Good morning | Hello);
「こんにちは」と言ってから Joan (または他の名前) を言うと、「Hello Joan」というテキストが返されます。
Sphinx4 を使用した Dictation Applicationのトピックを見ましたが、設定を変更すると常に が返され<unk>
ます。これは正しいステップですか?はいの場合、何が間違っていますか?