embedded - 小さな埋め込み合成音声ライブラリ/提案

Question

コードサイズが音声品質よりも重要なPICおよび/またはARM組み込みシステム用の使いやすい無料または安価な音声合成ライブラリはありますか? 最近では 1 メガのパッケージが「コンパクト」と見なされているようですが、多くのマイクロコントローラーはそれよりも小さいです。1980 年代にさかのぼると、Apple は 7.16MHz 68000 で動作する 26K パッケージで妥当な品質の音声を提供する Macintalk を作成するために請負業者を雇いました。 SpeakJet は、ある種の PIC で音声合成アルゴリズムを実行します。

特に音声を生成する必要はないかもしれませんが、事前に設定された多数の単語から形成されたメッセージを話せるようになりたいと考えています。もちろん、すべてのメッセージを単純に事前に録音することも可能ですが、たとえば 100 語の語彙を使用すると、16K 相当のコードとおそらく 1K 相当の音声文字列を格納する方が、100 語の音声を格納するよりもコンパクトになると思います。

あるいは、100 語の音声を保存したい場合、自然に一緒に流れる一連の単語を生成する最良の方法は何でしょうか? 古いスタイルの音声シンセサイザーでは、任意の単語を 3 つの方法で発声できました。中立的な抑揚、下向きの抑揚 (ピリオドが続くかのように)、または上向きの抑揚 (その後に疑問符が続く) です。ニュートラルな抑揚を持つ単語は、任意の順序でつなぎ合わせることができ、問題なく聞こえます。しかし、私が見つけた text-to-wave ツールは、単語が切り離されて並べ替えられた場合に「オフ」に聞こえる抑揚の詳細を追加するのが好きなようです。うまく連結してスプライスできるウェーブを生成するために設計されたツールはありますか? そのようなツールを使用する場合、小さなマイクロコントローラーで効率的にデコードできるように、波形を保存するのに最適なオーディオ形式は何ですか?

score 0 · Accepted Answer

前回これを行ったとき、http://www.sparkfun.com/products/9578 のようなハードウェアを追加できました。あなたの環境には、私が遭遇したように、商用ソフトウェアスタックまたは OTS チップを強制する特許責任がある可能性があります。

それ以外の場合は、http://www.speech.cs.cmu.edu/flite/をより寛大なプロジェクトに使用しましたが、うまくいきました。

embedded - 小さな埋め込み合成音声ライブラリ/提案

1 に答える 1

Related

Reference