.net - 最先端のテキスト読み上げをどのようにすればよいですか？

Question

昔は、テキスト読み上げは、最先端であったとしても、非常に不完全でした。あなたが単語をタイプしたとき、それはあなたがそれをどのように綴ったかをほとんど読むでしょう...単調に。多くの場合、結果は非常に面白いでしょう。今日、Text-to-Speechは頭が良すぎて、笑いを誘うような方法で間抜けすることはできません。

個人的なプロジェクトとして、この古いスタイルのテキスト読み上げをおもちゃとしてだけでも復活させることができるアプリケーションを作りたいと思っています。System.Speech.dll.Netでは、COMオブジェクトとCOMオブジェクトの両方を使用できSpeechLib ます。（Microsoft Speech Object Library）どちらもOSに組み込まれているText-to-Speechを使用しているようですが、これも賢すぎます。インテリジェントにするものを無効にするようにこれらを構成する方法はありますか？

いくつかの異なる「SayAs」オプションを試し、カルチャを不変に設定しようとしました（例外！）。そして今、SSMLを見ています。古いテクノロジー自体を見つけなければならないように見え始めていますが、どこから始めればよいのかさえわかりません。

私が見たいと思っている混乱の例として、ここにいくつかのMoonbase Alphaがあります：http ：//www.youtube.com/watch？v = Hv6RbEOlqRo （ヘッドフォンを着用していることを確認してください！）

これらの新しいテキストから音素へのコンバーター、ノーマライザー、ケーブルレス電話、そして...

score 4 · Accepted Answer

1970年代と1980年代にVotrax音声シンセサイザーで使用された「NRLアルゴリズム」と呼ばれるものが必要になるでしょう。私の友人が、私たちが（シリアルポートを介して）私のOsborne Iに接続したものの1つを持っていたのを覚えています。私たちは、それが物事を「言った」方法から多くの笑いを得ました。たとえば、「Computer」は「compooter」から出てきました。

あるいは、私の友人が持っていたのはMicrovoxだったのかもしれません。それはベルを鳴らしているようです。当時、すべてのテキスト読み上げボックスはほぼ同じテクノロジーを使用していました。リンクされた記事は情報の泉です。約半分は、テキストから音声への変換に関する長いセクションです。ルールと基本的なアルゴリズムについて説明します。いくつかの研究と実験で、Microvoxの音声合成を複製できると思います。

NRLアルゴリズムは、Unixのspeakコマンドによって実装されました。このコマンドのソースは、歴史の大部分に失われているようです。しかし、MDMcIlroyはそれについての論文を書きました。ルールによる合成英語スピーチ（スキャンされたページを含むtarファイルです）。

時間があれば、これは楽しいプロジェクトになるでしょう。頑張ってください。あなたがそれでどこにでも行くならば、私に知らせてください。

score 2 · Accepted Answer

さて、私はちょうど古い「MicrosoftVoiceText」ライブラリに出くわしました。vtext.dll

これが私が探していたもののようです！最新のTTSライブラリと比較すると、インターフェイスは非常にシンプルです。結果は、私がリンクしたそのビデオの音声とまったく同じではないようですが、それはおそらく別の実装でした。いずれにせよ、それは回想する時です。

var tts = new HTTSLib.TextToSpeech();
tts.Speak("ebrbrbrbrbrbrbrbr");

どういうわけか、「ここ」と言わせるとvshost.exeがクラッシュします。しかし、これは単なる個人的なプロジェクトなので、無視することができます。

.net - 最先端のテキスト読み上げをどのようにすればよいですか？

2 に答える 2

Related

Reference