校正済みの .srt ファイルがいくつかあり、AWS Polly によってそれらからオーディオを生成したいと考えています。AWS Polly のリファレンスによると、Polly の入力タイプはプレーン テキストまたは SSML 拡張テキストのいずれかです。.srt ファイルを SSML 拡張テキストに変換する方法はありますか?
.srt ファイルは校正されており、「オーディオの一時停止」情報がファイルに記録されているため、.srt ファイルを使用したいと考えています。例えば:
1
00:00:04,960 --> 00:00:06,880
- [Instructor] Bacteria
are able to inhabit
2
00:00:06,880 --> 00:00:09,220
almost every environment on Earth,
3
00:00:09,500 --> 00:00:12,740
from desert tundra to
tropical rainforests.
00:00:09220 から 00:00:09,500 の間にギャップがあります。これは、私たちが持っている「オーディオ一時停止」情報です。
AWS Polly の参照: https://docs.aws.amazon.com/polly/latest/dg/ssml-to-speech-console.html
.srt を SSML 拡張テキストに変換する方法がない場合、.srt ファイルを解析して、Polly が理解できる SSML 拡張テキストを生成する必要がありますか?