文字列があり、その文字列をシーケンスと一致させ、一致したシーケンスがそのシーケンスで見つかった回数を決定する必要がありますが、次の条件があります
文字列は ACGnkG で、n は A または G に置き換えることができます k は C または T に置き換えることができます
n と k に有効な値を代入して、文字列がシーケンスと一致するかどうかを調べる方法
正規表現はありますか?
re.findall(pattern, string)
pattern
in に一致するすべてのリストを返しstring
ます。len(...)
リスト内のアイテムの数を返します。
パターンの出現回数をカウントする場合:
count_regex = sum(1 for _ in re.finditer(r'ACG[AG][CT]G', s))
最初にパターンに一致する固定文字列の出現をカウントする場合:
m = re.search(r'ACG[AG][CT]G', s)
count_fixed = s.count(m.group(0), m.start(0)) if m else 0