-1

現在取り組んでいるプロジェクトでは、さまざまな言語の話し言葉のライブラリが必要です。

2つのオプションが可能と思われます。ネイティブスピーカーによるテキスト読み上げまたは「実際の」録音です。品質は私たちにとって重要なので、私たちは後者の道を進むことを考えています。

アプリケーションのプロトタイプを作成するために、さまざまな言語の単語をできるだけ多く含むライブラリを探しています。私たちのアプローチの質を感じるために、このライブラリは合成音声で構成されるべきではありません。

利用可能な/アクセス可能なライブラリを知っていますか?

4

5 に答える 5

3

同僚がこのコミュニティベースのライブラリを見つけました。これは素晴らしいですが、サイズがかなり小さいです。

Forvo.com

于 2008-09-27T11:13:20.697 に答える
0

Old time radioもありますが、これがあなたが求めている種類の話し言葉であるかどうかはわかりません。

于 2008-09-27T11:56:30.780 に答える
0

私の推測では、個々の単語だけで構成されたライブラリはどこにもないでしょう。見つけたものは何でも、エディター (Pro Tools や Cool Edit など) でオーディオを開いて、個々の単語に切り刻む必要があります。

各言語に必要なすべての単語のリストを作成し、録音中にネイティブ スピーカーを見つけてそれらを読む方がよいでしょう。ゆっくりと読んでもらうと、個々の単語を簡単に切り刻むことができます。

于 2008-09-27T12:28:32.717 に答える
0

Audacity wiki でこれを見つけました: VoxForge。彼らのサイトから:

VoxForge は、フリーおよびオープン ソースの音声認識エンジン (Linux、Windows、および Mac) で使用するために、文字起こしされた音声を収集するようにセットアップされました。

提出されたすべてのオーディオ ファイルを GPL ライセンスの下で利用できるようにし、Sphinx、ISIP、Julius、HTK などのオープン ソースの音声認識エンジンで使用する音響モデルに「コンパイル」します (注: HTK には配布制限があります)。

于 2008-09-27T11:42:12.047 に答える