MUC20 17615 NP_689886.2 MET 01280 NP_001120972.1 in vitro;in vivo;酵母 2 ハイブリッド 15314156
SMURF2 06901 NP_073576.1 TFPI2 08962 NP_006519.1 酵母 2 ハイブリッド 15231748
ERBB2 01281 NP_004439.2 ERBB2 01281 NP_004439.2 in vitro;in vivo 10372802,1706616,12354693,11500516
ACPP 01378 NP_001127666.1 ERBB2 01281 NP_004439.2 in vitro;in vivo 11067847,10851066,9705354
PIK3R1 01381 NP_852664.1 ERBB2 01281 NP_004439.2 インビボ 1351056,16843263
PLCG1 01398 NP_002651.2 ERBB2 01281 NP_004439.2 in vivo 1676673,1683701
……
助けてください。私のデータは次のようになります。Pythonを使用して、タンパク質のペアの名前(太字)のみを解析したい。そして、ペアになった名前は以下のように保存されます。たとえば、MUC20 10 MET です。そしてSMURF2 10 TFPI2。名前の間には、数字の 10 を挿入する必要があります。
MUC20 10 MET
SMURF2 10 TFPI2
ERBB2 10 ERBB2
ACPP 10 ERBB2
上記のように解析するにはどうすればよいですか?
ありがとうございました。