問題タブ [ssml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
text-to-speech - SSML を使用して話しているときにテキストの一部のセクションをスキップする方法
特定のテキスト行を話すことから削除するための SSML タグなどはありますか。はい、音声シンセサイザーに送信する前に、文字列関数を使用してこれを削除できることを知っています。しかし、私の質問は、テキストが再生されないように、テキストにマークまたはタグを付ける方法があるかどうかです。この問題に対する XML ベースのソリューションを探しています。
vxml - VoiceXMLプロンプトとSSMLエレメント。指定された位置からプロンプトを読み取る方法は?
<mark>要素は、読み取りがある程度まで進んだことを通知します。しかし、mark(name)idによって返された指定された位置からプロンプトを再度読み取る方法はありますか?
このようなシナリオで役立つ可能性があります。長いテキストを読んでいます。次に、ユーザーコマンド:PAUSE。やめます。次に、ユーザーは「続行」と言います。そして、最後の位置からプロンプトを読み続けます。
それは可能ですか?
そして、私はさらに別の質問をします。SSMLの使用法に関係なく、SSMLを機能させる方法-プロンプトの読み取りを一時停止してから、停止した位置から続行しますか?一時停止とは、「その一時停止を完全に制御する」ことを意味します。これにより、いつでも好きなときに続行できます。動的に。
android - Android TTSエンジンの発音を指定するためのベストプラクティス?
一般的に、私はAndroidのデフォルトのテキスト読み上げエンジン(つまり、com.svox.pico)に非常に感銘を受けています。予想通り、(私と同じように)いくつかの単語の発音を間違えるため、発音のガイダンスが必要になる場合があります。ですから、picoTTSエンジンが誤って発音している単語を音声で綴るベストプラクティスについて疑問に思っています。
たとえば、鳥Chachalacaの正しい発音はCHAH-chah-LAH-kahです。TTSエンジンが生成するものは次のとおりです。
これが私の質問です。
- Android TTSエンジンで認識される標準の音声スペルはありますか?
- そうでない場合、将来のTTSエンジン/バージョンでスペルが正しい可能性が高くなるカスタム発音スペルを作成するための一般的なルールはありますか?
- AndroidTTSエンジンはテキストの大文字小文字を無視しているようです。強調を指定する最良の方法は何ですか?
ちなみに、これはTTSエンジンがlogcatに書き込むものです。
V / TtsService(294):TTS処理:CHAH chah LOCKah
V / TtsService(294):TtsService.setLanguage(eng、USA、)
I / SVOX Pico Engine(294):言語は既にロードされています(en-US == en-US )
I / SynthProxy(294):発話速度を100に設定
I / SynthProxy(294):ピッチを100に設定
[アップデート]
次のように、XMLドキュメントをTextToSpeech.speak()に渡してみました。
Android Eveが示唆したように、TTSエンジンはXML本体(つまり、大型車と巨大な銀行口座に関するコメント)のみを読み取ります。TTSエンジンがXMLドキュメントを解析できることに気づいていませんでした。ただし、TTS出力の強調は聞こえませんでした。
[更新2]
ここでは、AndroidTTSが音声合成マークアップ言語をサポートしているかどうかという質問を簡略化しました。
android - Android TTSは音声合成マークアップ言語をサポートしていますか?
次のSSML(Speech Synthesis Markup Language)ドキュメントをcom.svox.pico TextToSpeechエンジンに渡すと、XML本体が読み取られましたが、音素要素または強調要素からの制御はありませんでした。この結果(明らかなSSMLコントロールはありません)は、Android2.2を実行しているNexusOneと、SDKレベル8でAVDを実行しているエミュレーターで同じです。
Android TTSエンジンはSSML要素のいずれかをサポートしていますか?
android - Android の TTS XML の音素属性の正しい構文は何ですか?
私の理解では、このX-SAMPA XML サンプルは、他のサンプルhereおよびhere & hereと同様に、何かのように聞こえるはずです。
しかし、なぜか何も言わない(無言)。
私は何が欠けていますか?
明確にするために:私のTTSサンプルアプリはセットアップOKです:そのタグの.
前を任意の単語に変更すると、Android TTSはその単語を問題なく言います. 私の唯一の問題は、をまったく利用できないことです。</speak>
<phoneme alphabet=\"xsampa\" ph=\"faIv\"/>
a が無音であることは理解してい.
ますが、これらのサンプルのポスターによると、XML で XSAMPA 音素を鳴らすことになっています。私は何が欠けていますか?
attributes - ssml の vxml 要素
tropo の ssml ファイルの vxml 要素に固執しています。
tropo はinterpret="time" を 認識せず 、私は interpret="vxml:time" を入力する必要があります。
ただし、フォーマット属性 format:"hms12" も定義する必要があります。だから私はこれを書きます:
<say-as interpret-as="vxml:time" format="hms12">243P</say-as> </s>
しかし、それは 3 つの整数のように発音し続けます。
どこでも正しい構文を検索しましたが、何かが見つかりませんでした。
ios - textToSpeech中に段落の後に一時停止する方法
textToSpeech に使用されるテキストがあります。ドラゴン モバイル SDK for iPhone から読み込んだテキストを一時停止
し
たいです。テキストには SSML がありません。空白のテキストのみ。
一時停止にはどのような文字を使用できますか? 「.」が一時停止した後、2 つの . を実行しようとしたことはわかっています。お気に入り "。 。" しかし、うまくいきません。
段落の後に一時停止するにはどうすればよいですか?
例:
ios - SSML を使用してテキスト読み上げを遅くする方法 - 音声が歪む/歪む/恐ろしい
テキスト読み上げを使用するために、iPhone用のニュアンスドラゴンモバイルSDKを使用しています。
読んだテキストは少し速いので、遅くしたいので、ユーザーは単語を学ぶことができます。私の目標は、テキストを少し遅くすることです。これは、SSML と prosody タグで非常にうまく機能します。次のコードを参照してください。
声は歪んで、歪んで、ぞっとするように聞こえます。
私が何を意味するか理解していますか?はっきりとした声でゆっくり話すテキスト
を得るにはどうすればよいですか?
c# - C# SAPI は SSML 文字列を話せますか?
C# WPF プロジェクトに TTS を実装しました。
以前は、System.Speech.Synthesis 名前空間の TTS を使用して話しました。話すコンテンツは、次のような SSML 形式 (Speech Synthesizer Markup Language、話す速度のカスタマイズ、音声、強調をサポート) です。
しかし、残念ながら System.Speech.Synthesis TTS にはメモリ リークの問題があります。.
そこで、SAPI COM コンポーネントを使用することにしました。SAPI にプレーン テキスト コンテンツを簡単に話させることができます。しかし、SSML文字列を話させようとし続けましたが、失敗しました。コードは次のようになります。
コードの重要な部分は
SpeechVoiceSpeakFlags 列挙を使用して、TTS の発話動作を指定します。フラグのいくつかの組み合わせを試しましたが、どれも SSML コンテンツをうまく読み上げることができませんでした。
特に、上記のコードは次の例外も発生させます。
System.Runtime.InteropServices.COMException が処理されませんでした
Message="HRESULT からの例外: 0x80045003"
Source="Interop.SpeechLib" ErrorCode=-2147201021 StackTrace: D:\Proj\TestSolutions\CSharp_Quick_Apps\SpeechSynthesisMemLeakTest\Program.cs の SpeechSynthesisMemLeakTest.Program.Test2() で SpeechLib.SpVoiceClass.Speak(文字列テキスト、SpeechVoiceSpeakFlags フラグ) で: Microsoft. VisualStudio.HostingProcess.HostProc.RunUsersAssembly() System.Threading.ExecutionContext.Run (ExecutionContext executionContext、ContextCallback コールバック、オブジェクト状態) で System.Threading.ThreadHelper.ThreadStart() InnerException:
フラグを正しく使用して SSML コンテンツを発言する方法を誰か教えてもらえますか?
svg - SVG アニメーションを作成してオーディオを同期する方法
SVG アニメーションを作成し、SSML を使用してナレーションを含めたいと考えています。理想的には、ブラウザでアニメーションを再生できるようにしたいと考えています。
私はいくつかの調査を行い、SMIL(Synchronized Multimedia Integration Language) が必要なように聞こえますが、収集できる限り、SMIL は広くサポートされていません (http://www.w3.org/AudioVideo/ は、「SYMM WG は2012 年 4 月 1 日以降閉鎖されています。"それが仕様が完全に死んでいることを意味するかどうかはわかりません)。
SVG、SSML、SMIL をサポートする開発ツールやプレーヤーがあれば教えてください。(Ambulent(http://www.ambulantplayer.org/) プレーヤーは SMIL をサポートしていますが、SSML はサポートしていません)?
また、他のテクノロジーで同じ結果を達成する方法についての提案もいただければ幸いです。