awk を使用して FASTA ファイルからシーケンスを抽出しようとしています。
たとえば、ファイルは次のようになり、703 シーケンスが含まれます。それぞれを個別のファイルに抽出したいと思います。
>sequence_1
AACTTGGCCTT
>sequence_2
AACTTGGCCTT
.
.
.
私はこのawkスクリプトを使用しています:
awk '/>/ {OUT=substr($0,2) ".fasta"}; OUT {print >OUT}'file.fasta
...これは機能しますが、最初は 16 に対してのみで、エラーが表示されます。
.fasta makes too many open files
input record number 35, file file.fasta
source line number 1