同じ長さの部分文字列のリストがあり、そのすべてについて大きな文字列内の位置を見つけたいと考えています。ただし、トリッキーな部分は、不一致の数が限られている部分文字列も見つける必要があることです (不一致の数も指定されています)。正規表現でこれができると思ったのですが、方法がわかりません。UPD: Python 2.7 を使用しています。
例: 入力文字列: s = 'ATGTCGATCGATGCTAGCTATAGATAAAA'
、入力部分文字列はs0 = 'ATG'
、許容される不一致の数は n = 1 です。私が望むのは、[0,7,19,23,6]
「ATG」(2 回)、「ATA」の位置に対応する位置の反復可能なリスト、たとえばリストを返すことです。 ' (2 回)、'ATC' は、一致しない他の 3-mer が文字列に発生しないためです。