audio - 音声サンプルのライブラリ（音声テキスト）

Question

現在取り組んでいるプロジェクトでは、さまざまな言語の話し言葉のライブラリが必要です。

2つのオプションが可能と思われます。ネイティブスピーカーによるテキスト読み上げまたは「実際の」録音です。品質は私たちにとって重要なので、私たちは後者の道を進むことを考えています。

アプリケーションのプロトタイプを作成するために、さまざまな言語の単語をできるだけ多く含むライブラリを探しています。私たちのアプローチの質を感じるために、このライブラリは合成音声で構成されるべきではありません。

利用可能な/アクセス可能なライブラリを知っていますか？

score 3 · Accepted Answer

同僚がこのコミュニティベースのライブラリを見つけました。これは素晴らしいですが、サイズがかなり小さいです。

Forvo.com

score 0 · Accepted Answer

Old time radioもありますが、これがあなたが求めている種類の話し言葉であるかどうかはわかりません。

score 0 · Accepted Answer

私の推測では、個々の単語だけで構成されたライブラリはどこにもないでしょう。見つけたものは何でも、エディター (Pro Tools や Cool Edit など) でオーディオを開いて、個々の単語に切り刻む必要があります。

各言語に必要なすべての単語のリストを作成し、録音中にネイティブスピーカーを見つけてそれらを読む方がよいでしょう。ゆっくりと読んでもらうと、個々の単語を簡単に切り刻むことができます。

score 0 · Accepted Answer

Audacity wiki でこれを見つけました: VoxForge。彼らのサイトから：

VoxForge は、フリーおよびオープンソースの音声認識エンジン (Linux、Windows、および Mac) で使用するために、文字起こしされた音声を収集するようにセットアップされました。

提出されたすべてのオーディオファイルを GPL ライセンスの下で利用できるようにし、Sphinx、ISIP、Julius、HTK などのオープンソースの音声認識エンジンで使用する音響モデルに「コンパイル」します (注: HTK には配布制限があります)。

audio - 音声サンプルのライブラリ（音声テキスト）

5 に答える 5

Related

Reference