speech-recognition - Sphinx4 で音声を音素にデコードする

Question

CMUSphinx4 を使用して特定の音声を音素にデコードし、それらの音素をさらに実装することはできますか?

score 3 · Accepted Answer

sphinx4 (ベータ 6) を使用している場合、フレームワーク内にgetBestPronunciationResult()というメソッドがあります。

「このメソッドは、アプリケーションが最適な最終パスで音素を必要とする場合に使用されます。単語には複数の発音がある可能性があるため、これは単語パスと同等ではないことに注意してください。たとえば、one [HH、W、AH、N] to [T ,UW] 3[TH,R,IY]

戻り値: 最適パス上の単語と関連する音素の文字列"

場所: src/sphinx4/edu/cmu/sphinx/result/Result.java

Token.java は実際の作業を行うクラスです。

お役に立てれば。

score 1 · Accepted Answer

認識結果オブジェクトを取り込んで音素をダンプするこのサンプルコードを見つけました: http://cmusphinx.sourceforge.net/wiki/sphinx4:unittimestamps

Sphinx4 を理解するには、この論文が非常に役立つことがわかりました: http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4Whitepaper.pdf

アーキテクチャを理解したら、javadoc ページにあるパッケージのリストを調べました。

それが役立つことを願っています。幸運を！

speech-recognition - Sphinx4 で音声を音素にデコードする

2 に答える 2

Related

Reference