入力は次のようになります。
CNNCC
NCNCN
NNNCC
CCNNN
CCCCN
出力は次のようになります。
CNNCC
CCCCN
つまり、が3回以上発生した場合N
、その行は除外され、それ以外の場合は保持されます。(私の仕事では、500 Nを超える100000行を除外する必要があるため、パフォーマンスが重要になる可能性があります)
awkで連続してフィルタリングする方法は知っていますが、連続N
していないものを計算する方法がわかりません。
誰かがこれについてアイデアを持っていますか?のソリューションshell
もOKです。
すべての答えの中で、私はこれが最も単純かもしれないと思います:
awk -FN 'NF<=3'