本当に初歩的な質問ですが、これを機能させることはできません。私のサンプルテキストはページの下部にあります。
残しておきたい唯一の行は、「178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95」のようなものです。私は現在、正規表現の置き換えを提供する OSX (端末と私は友達ではありません) で TextWrangler を使用しています。私はこれを段階的に行おうとしています.私の最初のステップは、すべてのタンパク質配列を取り除こうとすることです.
TextWrangler で、これを検索します。
ワーキングシーケンス([^;]*)----------------------------------------- -------------------
何も置き換えません。しかし、TextWrangler は "Working sequence" の最初のインスタンスを見つけたように見えますが、"----------------- -----------------------------------------------」。これが段階的なプロセスになるように変更するにはどうすればよいですか?両方の最初のインスタンスを見つけて何も置き換えず、次に 2 番目のインスタンスなどを置き換えますか?
スウェーデンからの感謝と挨拶
タンパク質の結果の要約: sp|P08195|4F2_HUMAN 4F2 GN=SLC3A2 PE=1 SV=3 Translocon TM 分析結果 分割: 水から二重層 ウィンドウ範囲: 19-30
translocon TM 予測セグメント数: 2
178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95
438-460 23 ARLLTSFLPAQLLRLYQLMLFTL 1,63
作業シーケンスの長さ = 630):
MELQPPEASIAVVSIPRQLPGShSEAGVQGLSAGDDSELGShCVAQTGLELLASGDPLPS ASQNAEMIETGSDCVTQAGLQLLASSDPPALASKNAEVTGTMSQDTEVDMKEVELNELEP EKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVR TRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWhTGALYRIGDLQAFQGhGAGN LAGLKGRLDYLSSLKVKGLVLGPIhKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKK SIRVILDLTPNYRGENSWFSTQVDTVATKVKDALEFWLQAGVDGFQVRDIENLKDASSFL AEWQNITKGFSEDRLLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEhTKSLVT QYLNATGNRWCSWSLSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALP GQPMEAPVMLWDESSFPDIPGAVSANMTVKGQSEDPGSLLSLFRRLSDQRSKERSLLhGD FhAFSAGPGLFSYIRhWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQ PGREEGSPLELERLKLEPhEGLLLRFPYAA
タンパク質の結果の要約: sp|Q9NPC4|A4GAT_HUMAN OS=Homo sapiens GN=A4GALT PE=2 SV=1 Translocon TM 分析結果 分割: 水から二重層 ウィンドウ範囲: 19-30
translocon TM 予測セグメント数: 1
19-43 25 RVCTLFIIGFKFTFFVSIMIYWhVV -1,04
作業シーケンスの長さ = 353):
MSKPPDLLLRLLRGAPRQRVCTLFIIGFKFTFFVSIMIYWhVVGEPKEKGQLYNLPAEIP CPTLTPPTPPShGPTPGNIFFLETSDRTNPNFLFMCSVESAARThPEShVLVLMKGLPGG NASLPRhLGISLLSCFPNVQMLPLDLRELFRDTPLADWYAAVQGRWEPYLLPVLSDASRI ALMWKFGGIYLDTDFIVLKNLRNLTNVLGTQSRYVLNGAFLAFERRhEFMALCMRDFVDh YNGWIWGhQGPQLLTRVFKKWCSIRSLAESRACRGVTTLPPEAFYPIPWQDWKKYFEDIN PEELPRLLSATYAVhVWNKKSQGTRFEATSRALLAQLhARYCPTThEAMKMYL