シーケンスデータを含むファイルがあります。新しい段落(2行の空白行で区切られています)には、新しいシーケンスが含まれています。
#example
ASDHJDJJDMFFMF
AKAKJSJSJSL---
SMSM-....SKSKK
....SK
SKJHDDSNLDJSCC
AK..SJSJSL--HG
AHSM---..SKSKK
-.-GHH
そして、私は次のようなファイルになりたいです:
ASDHJDJJDMFFMFAKAKJSJSJSL---SMSM-....SKSKK....SK
SKJHDDSNLDJSCCAK..SJSJSL--HGAHSM---..SKSKK-.-GHH
各シーケンスは同じ長さです(それが役立つ場合)。
また、異なるディレクトリに保存されている複数のファイルに対してこれを実行することも検討しています。
試したばかり
sed -e '/./{H;$!d;}' -e 'x;/regex/!d' ./text.txt
ただし、これによりファイル全体が削除されました:S
どんな助けでも喜ばれるでしょう-あなたがperlまたは何か他のものでそれをする方法を知っているなら、それはまた素晴らしいです。
ありがとう。