CMUSphinx4 を使用して特定の音声を音素にデコードし、それらの音素をさらに実装することはできますか?
2 に答える
sphinx4 (ベータ 6) を使用している場合、フレームワーク内にgetBestPronunciationResult()というメソッドがあります。
「このメソッドは、アプリケーションが最適な最終パスで音素を必要とする場合に使用されます。単語には複数の発音がある可能性があるため、これは単語パスと同等ではないことに注意してください。たとえば、one [HH、W、AH、N] to [T ,UW] 3[TH,R,IY]
戻り値: 最適パス上の単語と関連する音素の文字列"
場所: src/sphinx4/edu/cmu/sphinx/result/Result.java
Token.java は実際の作業を行うクラスです。
お役に立てれば。
認識結果オブジェクトを取り込んで音素をダンプするこのサンプル コードを見つけました: http://cmusphinx.sourceforge.net/wiki/sphinx4:unittimestamps
Sphinx4 を理解するには、この論文が非常に役立つことがわかりました: http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4Whitepaper.pdf
アーキテクチャを理解したら、javadoc ページにあるパッケージのリストを調べました。
それが役立つことを願っています。幸運を !