5

きれいな音声と北京語の音声のみを含む多くの音声ファイルがあります。各ファイルで話されている音節の数を見積もる必要があります。これらを推定できる OS X、Windows、または Linux 用のツールはありますか?

sample01.wav 15
sample02.wav 8
sample03.wav 5
sample04.wav 1
sample05.wav 18

多くのファイルがあるため、コマンドラインまたはバッチ対応のソフトウェアが推奨されます。

$ application sample01.wav
15
  • 音声からテキストへの変換を使用し、存在する文字数をカウントするソリューションが適しています。
4

4 に答える 4

1

フォルマントを使用してこれを決定できます。各音節はフォルマントに対応する必要があります。フォルマントの詳細は次のとおりです。

https://en.wikipedia.org/wiki/Formants

于 2013-11-01T14:31:08.943 に答える
0

あなたの質問には、Speech to Text に関する特定の注意と解決策が必要です。簡単に利用でき、目的にかなった無料のオープンソースライブラリが提供されるとは思えません。

私は1つを使用しましたが、逆の目的で「テキストからスピーチ」に使用しました。これは無料のライブラリではありませんが、Google の「annosoft lipsync」だけでもお役に立てれば幸いです...

http://www.annosoft.com/lipsync-sdks

このライブラリは、SDK の評価にも使用できます....

于 2013-11-10T18:24:09.067 に答える
0

これはあなたにとって興味深いかもしれません

http://sites.google.com/site/speechrate/

于 2013-11-10T14:09:43.510 に答える