linux - [ACGTN] 以外の文字を SED で削除する方法

Question

「A」、「C」、「G」、「T」、「N」以外の文字列を sed に置き換えるにはどうすればよいですか?

たとえば、次のデータがあります。

>AFCCCCC 1
cagktgagtgataaggc
>AFCGH22 1
cagntgagtgstaaggc

「>」で始まらない行の [ACGTN] ではないすべての文字を削除したい

したがって、次の出力が得られることを願っています。

 >AFCCCCC 1
 cagtgagtgataaggc
 >AFCGH22 1
 cagntgagtgtaaggc

最初と 2 番目のシーケンスの「k」と「s」を削除したことに注意してください。

score 2 · Accepted Answer

2

これを試して：

sed '/^>/!s/[^ACGTN]//ig' input.txt

于 2012-07-06T00:07:00.383 に答える

1 に答える 1