nlp - 音声ファイルで話された音節の数を数える方法は?

Question

きれいな音声と北京語の音声のみを含む多くの音声ファイルがあります。各ファイルで話されている音節の数を見積もる必要があります。これらを推定できる OS X、Windows、または Linux 用のツールはありますか?

sample01.wav 15
sample02.wav 8
sample03.wav 5
sample04.wav 1
sample05.wav 18

多くのファイルがあるため、コマンドラインまたはバッチ対応のソフトウェアが推奨されます。

$ application sample01.wav
15

score 1 · Accepted Answer

フォルマントを使用してこれを決定できます。各音節はフォルマントに対応する必要があります。フォルマントの詳細は次のとおりです。

score 0 · Accepted Answer

あなたの質問には、Speech to Text に関する特定の注意と解決策が必要です。簡単に利用でき、目的にかなった無料のオープンソースライブラリが提供されるとは思えません。

私は1つを使用しましたが、逆の目的で「テキストからスピーチ」に使用しました。これは無料のライブラリではありませんが、Google の「annosoft lipsync」だけでもお役に立てれば幸いです...

http://www.annosoft.com/lipsync-sdks

このライブラリは、SDK の評価にも使用できます....

score 0 · Accepted Answer

これはあなたにとって興味深いかもしれません

4 に答える 4