これは私の入力がどのように見えるかです:
>a
AACTCTCTC
CGTGCTCTC
>b_random
ACTGSTSTS
CTCTCTCCT
ATATATA
>c
AACTCTCTC
CGTGCTCTC
>d
AACTCTCTC
CGTGCTCTC
CGTGCTCTC
>e_random
ACTGSTSTS
CTCTCTCCT
ATATATA
>c_random
ACTGSTSTS
CTCTCTACT
GSTSTSCTC
TCTCCTCCT
ATATATA
「random」という語句を含むすべてのシーケンスを削除したいと考えています。シーケンスは常に ">" で始まり、別のシーケンスが始まると終了します。
この場合、3 つのファイルを取得したいと思います。
a.txt
>a
AACTCTCTC
CGTGCTCTC
c.txt
>c
AACTCTCTC
CGTGCTCTC
d.txt
>d
AACTCTCTC
CGTGCTCTC
CGTGCTCTC
今のところ、どうにかして sed に自分のやりたいことを強制することはできません。私はこれから始めました:
sed 's/random.*random//g' sample_data
何が機能していません。どうもありがとうございました。