regex - AWK: 複数のファイルに行を書き込む

Question

awk を使用して FASTA ファイルからシーケンスを抽出しようとしています。

たとえば、ファイルは次のようになり、703 シーケンスが含まれます。それぞれを個別のファイルに抽出したいと思います。

>sequence_1
AACTTGGCCTT
>sequence_2
AACTTGGCCTT
.
.
.

私はこのawkスクリプトを使用しています：

awk '/>/ {OUT=substr($0,2) ".fasta"}; OUT {print >OUT}'file.fasta

...これは機能しますが、最初は 16 に対してのみで、エラーが表示されます。

.fasta makes too many open files
input record number 35, file file.fasta
source line number 1

score 3 · Accepted Answer

完了したら、ファイルを閉じる必要があります。試す：

awk '/>/ {close(OUT); OUT=substr($0,2) ".fasta"}; OUT {print > OUT}' file.fasta

1 に答える 1