サンプル入力:
ACGTTGCATGTCGCATGATGCATGAGAGCT # これは検索するシーケンスです
4 # this is the k-mer(integer value)
サンプル出力:
CATG GCAT
これを行う方法がわかりません。私を助けてください。前もって感謝します。
サンプル入力:
ACGTTGCATGTCGCATGATGCATGAGAGCT # これは検索するシーケンスです
4 # this is the k-mer(integer value)
サンプル出力:
CATG GCAT
これを行う方法がわかりません。私を助けてください。前もって感謝します。
私があなたの質問を正しく理解していれば、リストを操作する 1 つの方法を次に示します。
s="ACGTTGCATGTCGCATGATGCATGAGAGCT"
n=4
k=len(s)-2*n
klist = []
for i in range(k):
kmer=s[i:i+n]
if not(kmer in klist) and (kmer in s[i+n:]):
klist.append(kmer)
print klist
私が誤解していない限り、あなたの例には予想よりもいくつかの kmers があったようです:
['TGCA', 'GCAT', 'CATG', 'ATGA']
の場合n = 5
:
['TGCAT', 'GCATG', 'CATGA']
そして、次の場合でもn = 6
:
['TGCATG', 'GCATGA']