「A」、「C」、「G」、「T」、「N」以外の文字列を sed に置き換えるにはどうすればよいですか?
たとえば、次のデータがあります。
>AFCCCCC 1
cagktgagtgataaggc
>AFCGH22 1
cagntgagtgstaaggc
「>」で始まらない行の [ACGTN] ではないすべての文字を削除したい
したがって、次の出力が得られることを願っています。
>AFCCCCC 1
cagtgagtgataaggc
>AFCGH22 1
cagntgagtgtaaggc
最初と 2 番目のシーケンスの「k」と「s」を削除したことに注意してください。