-1

awk を使用して FASTA ファイルからシーケンスを抽出しようとしています。

たとえば、ファイルは次のようになり、703 シーケンスが含まれます。それぞれを個別のファイルに抽出したいと思います。

>sequence_1
AACTTGGCCTT
>sequence_2
AACTTGGCCTT
.
.
.

私はこのawkスクリプトを使用しています:

awk '/>/ {OUT=substr($0,2) ".fasta"}; OUT {print >OUT}'file.fasta

...これは機能しますが、最初は 16 に対してのみで、エラーが表示されます。

.fasta makes too many open files
input record number 35, file file.fasta
source line number 1
4

1 に答える 1

3

完了したら、ファイルを閉じる必要があります。試す:

awk '/>/ {close(OUT); OUT=substr($0,2) ".fasta"}; OUT {print > OUT}' file.fasta
于 2013-03-21T18:09:01.713 に答える