1

TPythonで、18文字(任意の文字)で始まり、、、、またはのいずれかで終わるすべてのDNAシーケンスに一致する正規表現を作成しようとしていAAます。最初の部分は管理できますが、正規表現を4回複製せずに最後(2文字)を書く方法を見つけることができないようです。これが私が終わるシーケンスのために持っているものです:TTCCGGTT

import re
seq='ATGTGTGGACACAAGTGACAGTTTACGATGAGGTTACAGCCCGCA'
match=re.findall('T.{18}TT',seq)
print match
4

1 に答える 1

5

良いチュートリアルをチェックしてください。

交代と呼ばれる概念があります。指定されたオプションのいずれかに一致します。

r'T.{18}(?:TT|AA|CC|GG)'

Pythonで正規表現をエンコードするには、生の文字列を使用する必要があることに注意してください。そうしないと、後で文字をエスケープする際に問題が発生します。

于 2012-11-16T01:33:14.913 に答える