T
Pythonで、18
文字(任意の文字)で始まり、、、、またはのいずれかで終わるすべてのDNAシーケンスに一致する正規表現を作成しようとしていAA
ます。最初の部分は管理できますが、正規表現を4回複製せずに最後(2文字)を書く方法を見つけることができないようです。これが私が終わるシーケンスのために持っているものです:TT
CC
GG
TT
import re
seq='ATGTGTGGACACAAGTGACAGTTTACGATGAGGTTACAGCCCGCA'
match=re.findall('T.{18}TT',seq)
print match