ARPA 言語モデル形式に関するドキュメントはどこにありますか?
ポケットスフィンクスSTTエンジンを使った簡単な音声認識アプリを開発しています。そこでは、パフォーマンス上の理由から ARPA が推奨されます。カスタム ニーズに合わせて言語モデルを調整するために、どの程度のことができるかを理解したいと考えています。
私が見つけたのは、いくつかの非常に簡単な ARPA 形式の説明だけです。
- http://kered.org/blog/2008-08-12/arpa-language-model-file-format/
- http://www.speech.sri.com/projects/srilm/manpages/ngram-format.5.html
- http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html
私は STT の初心者であり、これを理解するのに苦労しています (n-gram など...)。より詳細なドキュメントを探しています。ここのJSGF文法に関するドキュメントのようなもの: