英語の voxforge モデルで sphinx4 または pocketphinx を使用する方法を理解しようとしていますが、うまくいきません。ドキュメント ページ (このようなhttp://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.htmlなど)を読み込もうとしましたが、役に立ちません。
私が欲しいのは、使用するモデルとソースとして使用するオーディオ ファイルを指定し、実行可能ファイルを印刷して、録音の声が何を言っているのかを推測できる実行可能ファイルです。
私はいくつかの運が良かった: pocketphinx_continuous -infile recording.wav 2> /dev/null
しかし、完全な音声ファイルが書き起こされる前に中止され、デフォルトのモデルでは、音声から読み取り可能なテキストを作成するための単語がほとんどありません。
私は sphinx4 ソース パッケージのデモをコンパイルしてテストしましたが、すべての例は単語が少ないようで、私にとって役立つには voxforge のようなモデルが必要です。
どうすればこれを設定できますか?