python - Python正規表現の繰り返し文字

Question

TPythonで、18文字（任意の文字）で始まり、、、、またはのいずれかで終わるすべてのDNAシーケンスに一致する正規表現を作成しようとしていAAます。最初の部分は管理できますが、正規表現を4回複製せずに最後（2文字）を書く方法を見つけることができないようです。これが私が終わるシーケンスのために持っているものです：TTCCGGTT

import re
seq='ATGTGTGGACACAAGTGACAGTTTACGATGAGGTTACAGCCCGCA'
match=re.findall('T.{18}TT',seq)
print match

score 5 · Accepted Answer

良いチュートリアルをチェックしてください。

交代と呼ばれる概念があります。指定されたオプションのいずれかに一致します。

r'T.{18}(?:TT|AA|CC|GG)'

Pythonで正規表現をエンコードするには、生の文字列を使用する必要があることに注意してください。そうしないと、後で文字をエスケープする際に問題が発生します。

python - Python正規表現の繰り返し文字

1 に答える 1

Related

Reference