文字列(字幕)を次から変換したい:
585
00:59:59,237 --> 01:00:01,105
- It's all right. - He saw us!
586
01:00:01,139 --> 01:00:03,408
I heard you the first time.
の中へ
59:59 - 大丈夫です。- 彼は私たちを見た!
01:00:01 初めて聞きました。
*私が望むのは: 時間が 1 時間以内の場合は "00:" プレフィックスを削除し、時間が 1 時間を超える場合はそのままにしておきます *
私の正規表現は次のとおりです。
pat = re.compile(r"""
#\s* # Skip leading whitespace
\d+\s # remoe lines contain only numbers
((?:(?:00)|(?P<hour>01)):(?P<time>\d{2}:\d{2})[,0-9->]+.*)[\r\n]+(?P<content>.*)[\r\n]+
""",
re.VERBOSE)
data = pat.sub(r"\g<hour>\g<time> \g<content>", data)
' ' が使用されていない場合にのみ機能し\g<hour>
ます。誰でも私を助けることができますか?