0

私は本当にこの問題を解決しようとしましたが、これまで誰もこの問題に直面していなかったようです. 1000G から fastq ファイルを解凍しました。

gunzip -c **hs37d5.fa.gz** | awk '{if(NR%4==1) {printf(">%s\n",substr($0,2));} else if(NR%4==2) print;}' > ref.fa

ただし、解凍されたフォルダーには「末尾のゴミ」があり、次のエラーが発生します。

「スレッド「メイン」の例外 picard.PicardException: シーケンス名が参照に複数回表示されます: NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN

実行しようとすると:

java -jar picard.jar CreateSequenceDictionary R=ref.fasta O=ref.dict

誰かが私に少し助けを与えることができれば、それは大歓迎です.

4

0 に答える 0