次のような多くのエントリで構成されるファイルがあります。
>1761420406686363113470.1
CAAGATTCTGAGATAATCGCGGTTTAAAGTTTCAAATTTGTTTCGGCCGATTCGAAGTCA
つまり、 > で始まるヘッダー行と、多数のシーケンス行の後にヘッダー行が続きます。>で始まる行のみに移動し(シーケンス行ではなく)、最初の10桁を除くすべてを削除するsedスクリプトを作成しようとしています。
これと似たような質問がたくさんありますが、私にはわかりません。私はこのコードのバリエーションを試してきました:
sed 's/^>..........*/^>........../' input.fasta
しかし、明らかにそれを正しく行っていません..