昔は、テキスト読み上げは、最先端であったとしても、非常に不完全でした。あなたが単語をタイプしたとき、それはあなたがそれをどのように綴ったかをほとんど読むでしょう...単調に。多くの場合、結果は非常に面白いでしょう。今日、Text-to-Speechは頭が良すぎて、笑いを誘うような方法で間抜けすることはできません。
個人的なプロジェクトとして、この古いスタイルのテキスト読み上げをおもちゃとしてだけでも復活させることができるアプリケーションを作りたいと思っています。System.Speech.dll
.Netでは、COMオブジェクトとCOMオブジェクトの両方を使用できSpeechLib
ます。(Microsoft Speech Object Library)どちらもOSに組み込まれているText-to-Speechを使用しているようですが、これも賢すぎます。インテリジェントにするものを無効にするようにこれらを構成する方法はありますか?
いくつかの異なる「SayAs」オプションを試し、カルチャを不変に設定しようとしました(例外!)。そして今、SSMLを見ています。古いテクノロジー自体を見つけなければならないように見え始めていますが、どこから始めればよいのかさえわかりません。
私が見たいと思っている混乱の例として、ここにいくつかのMoonbase Alphaがあります:http ://www.youtube.com/watch?v = Hv6RbEOlqRo (ヘッドフォンを着用していることを確認してください!)
これらの新しいテキストから音素へのコンバーター、ノーマライザー、ケーブルレス電話、そして...