1

複数の列を含むファイル .ped があり、そこから情報を抽出したいと考えています。ここに私のデータのサンプルがあります(ヘッダーはありません):

1  1  1 
1  2  1
2  3  2
3  4  1
3  5  2
...

最初の列は ID 家族、2 番目の列は ID 個人、3 番目の列は個人の性別を示します。

テーブルをデータフレームとして読み取ります

ped <- read.table("pedigree.ped", header=FALSE)

存在するファミリーの数を計算する方法は? 1 が男性で 2 が女性である性別の列がありますが、データ セット内の男性と女性の分布を取得するにはどうすればよいですか?

あなたがいくつかのコードを与えることができれば、私はRの初心者です!

ありがとうございます。

4

2 に答える 2

2

これを使用してデータを探索してみてください。

For family:
table(ped[,1])

For sex: 
table(ped[,3])
于 2013-04-06T02:14:45.677 に答える
2

Since you are new to R, I would suggest looking into excel first. The operations you are asking for is fairly simple and can be done in excel.

If you want to use R then look into data.frame indexing, subsetting etc.

If you are familiar with SQL, look in to sqldf package

Number of families:

numFamilies <- length(unique(ped[,1]))

Number of males & females:

numMales <- sum(ped[,3] == 1)
numFemales <- sum(ped[,3] == 2)
于 2013-04-06T01:49:18.850 に答える