1000 ゲノム プロジェクトは、人間の参照 DNA 配列に対する数千人の DNA 配列の「バリエーション」に関する情報を提供します。バリエーションはVCFファイル
形式で保存されます。基本的に、そのプロジェクトの各人物について、VCF ファイルから DNA 変異情報を取得できます。たとえば、変異のタイプ (挿入/削除や SNP など) や参照に対する変異の位置などです。参照は FASTA 形式です。VCF ファイルからの 1 人のバリエーション情報と FASTA ファイル内の人間のリファレンスを組み合わせて、その人物の DNA 配列を構築したいと考えています。
私の質問は、タスクをうまく実行できるツールがすでに存在するか、それとも自分でスクリプトを作成する必要があるかということです。