私は本当にこの問題を解決しようとしましたが、これまで誰もこの問題に直面していなかったようです. 1000G から fastq ファイルを解凍しました。
gunzip -c **hs37d5.fa.gz** | awk '{if(NR%4==1) {printf(">%s\n",substr($0,2));} else if(NR%4==2) print;}' > ref.fa
ただし、解凍されたフォルダーには「末尾のゴミ」があり、次のエラーが発生します。
「スレッド「メイン」の例外 picard.PicardException: シーケンス名が参照に複数回表示されます: NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
実行しようとすると:
java -jar picard.jar CreateSequenceDictionary R=ref.fasta O=ref.dict
誰かが私に少し助けを与えることができれば、それは大歓迎です.