1

だから私はサーバー上にこれのファイルを持っています:

COADREAD ATF7 Missense_Mutation NGXA-AZ-3984 P17544 A436T

COADREAD ATG10 Missense_Mutation NGXA-AB-A010 Q9H0Y0 H133N

私の目標は、ファイルの列5にあるID(P17544)を見つけて、その背後にあるトークンの番号である436(この番号は間にあると想定されています)をキャプチャ/保存します(後でその番号を印刷する必要があります) 6列目のA436Tからの2文字)。これを行う方法はありますか?以前にlxmlを少し使用しましたが、これを行う方法はまだわかりません。前もって感謝します

これが私が持っているものです

ファイル = 開く ('text.txt','r')

検索={}

ファイルの行:

myid, token = file.rsplit(' ', 2)[1:]

token = token[1:-1] 
4

2 に答える 2

0

非常に簡単に聞こえます...スペースに沿って分割し、5番目のフィールドを抽出します...そして6番目のフィールドからすべての数字を抽出します。または、何か不足していますか?

>>> tokens = "COADREAD ATF7 Missense_Mutation NGXA-AZ-3984 P17544 A436T".split()
>>> print tokens[4]
P17544
>>> print ''.join([c for c in tokens[5] if c.isdigit()])
436
于 2012-07-11T20:46:17.533 に答える