この小さな SSML をスピーチ プロセッサに送信すると、2 つの音声が得られます。
<speak version='1.0' xml:lang='es-ES'>
<voice xml:lang='es-ES' xml:gender='Male' name='Microsoft Server Speech Text to Speech Voice (es-ES, Pablo, Apollo)'>
<p>
<s>Hola </s>
<s xml:lang='en'>Hello</s>
<s>¿Cómo estas?.</s>
</p>
</voice>
</speak>
スペイン語の男性と英語の女性。これは Project Oxford Text to Speech エンジンの制限ですか? つまり、同じ声が複数の言語を話すことを期待しますが、そうではないようです。