と の 2 つのファイルがpedigree.ped
ありpedigree.map
ます。これら 2 つのファイル形式はPlinkで使用できます。
私の場合、R で使用したいので、R 形式に変換する必要があると思います。例: Plink の欠損値は R の欠損値とは異なります。
これら 2 つのファイルを変換して R で使用するにはどうすればよいですか? 欠損値を NA に変更するにはどうすればよいですか?
私のデータのサンプル:
ped ファイル:
1 1 0 0 1.02 A A G G 0 0
1 2 0 0 0.51 T G C C A A
2 3 1 2 -9 0 0 A G T T
...
最初の列は id_family、2 番目は id_individual、3 番目と 4 番目は id_individual の父と母、5 番目は量的形質 (-9 : 欠損値)、残りの列は遺伝子型 (SNPs allele) です。列の欠損値は 0 ですが、量的形質は -9 です。
マップ ファイル:
1 rs1 0 100000
1 rs2 0 100100
1 rs3 0 100200
最初の列は id 染色体 (1-22、X、Y、または配置されていない場合は 0)、2 番目の列は rs# または snp 識別子、3 番目は遺伝的距離 (morgans)、4 番目は塩基対の位置 (bp 単位) です。