3

と の 2 つのファイルがpedigree.pedありpedigree.mapます。これら 2 つのファイル形式はPlinkで使用できます。

私の場合、R で使用したいので、R 形式に変換する必要があると思います。例: Plink の欠損値は R の欠損値とは異なります。

これら 2 つのファイルを変換して R で使用するにはどうすればよいですか? 欠損値を NA に変更するにはどうすればよいですか?

私のデータのサンプル:

ped ファイル:

1 1 0 0 1.02  A A   G G   0 0
1 2 0 0 0.51  T G   C C   A A
2 3 1 2 -9    0 0   A G   T T
...

最初の列は id_family、2 番目は id_individual、3 番目と 4 番目は id_individual の父と母、5 番目は量的形質 (-9 : 欠損値)、残りの列は遺伝子型 (SNPs allele) です。列の欠損値は 0 ですが、量的形質は -9 です。

マップ ファイル:

1 rs1 0 100000
1 rs2 0 100100
1 rs3 0 100200

最初の列は id 染色体 (1-22、X、Y、または配置されていない場合は 0)、2 番目の列は rs# または snp 識別子、3 番目は遺伝的距離 (morgans)、4 番目は塩基対の位置 (bp 単位) です。

4

2 に答える 2