markers - SSML の入手方法Google Cloud テキスト読み上げ API からのタイムスタンプ

翻译自：https://stackoverflow.com/questions/57381977 2019-08-06T18:24:55.993

1048 次

Google Cloud text-to-speech API でSSML マーカーを使用して、オーディオストリームでこれらのマーカーのタイミングをリクエストしたいと考えています。これらのタイムスタンプは、効果、単語/セクションの強調表示、およびユーザーへのフィードバックの手がかりを提供するために必要です。

質問はSSMLタグではなく、各単語のタイムスタンプを参照していますが、関連するこの質問を見つけました。<mark>

次の API リクエストは OK を返しますが、リクエストされたマーカーデータが不足していることを示しています。これはを使用していCloud Text-to-Speech API v1ます。

{
 "voice": {
  "languageCode": "en-US"
 },
 "input": {
  "ssml": "<speak>First, <mark name=\"a\"/> second, <mark name=\"b\"/> third.</speak>"
 },
 "audioConfig": {
  "audioEncoding": "mp3"
 }
}

応答：

{
 "audioContent":"//NExAAAAANIAAAAABcFAThYGJqMWA..."
}

コンテキスト情報なしで合成オーディオのみを提供します。

IBM WatsonやAmazon Pollyの場合のように、これらのマーカーに関する情報を公開できる、見落としている API リクエストはありますか?

markers - SSML の入手方法Google Cloud テキスト読み上げ API からのタイムスタンプ

2 に答える 2

Related

Reference