次のような文字列を含むファイルがあります。
NM_???? chr12 - 10 110 10 110 3 10,50,100, 20,60,110,
最後の 2 つの列に興味があります。最初の列はエクソンスタートのカンマ区切りのリストで、最後の列はエクソンエンドのカンマ区切りのリストです。
とは言っても、私は次のことをしました:
fp = open(infile, 'r')
for line in fp:
tokens = line.split()
exonstarts = tokens[8][:-1].split(',')
exonends = tokens[9][:-1].split(',')
zipped = list(zip(exonstarts, exonends))
これで、次のようなリストができました。
[(10, 20), (50, 60), (100, 110)]
私には別の問題があります。たとえば、私はchr_string[10:20]+chr_string[50:60]+chr_string[100:110]
これを簡単に言う方法はありますか??