SSML prosody 要素は、相対的な変化を表す値を取ることができます。これはパーセンテージ値 (+50% または -30% など) の場合があります。
それは何パーセントになるべきですか?現在のピッチの Hz 値ですか (つまり、オクターブ間隔 (つまり +12st) は +100% と同じです)。それとも、x-low と x-high の間の範囲など、何か他のものに関連していますか (したがって、x-low +50% は中と同じで、別の +50% は x-high です)? 決定するのは実装者に任されているだけですか?
SSML は音楽をマークアップするためのシステムではなく、これは発話全体が配信される正確なピッチではなく、「ベースライン ピッチ」または発話を表すことを理解しています。特定の式が同等と見なされるかどうかを知りたいだけです。