-1

R でこれを行う簡単な方法があるかどうかはわかりません。約 5000 行の 3 つの列 (子、父、母) があります。父親の列にゼロ (0) を 25%、50%、および 75% に割り当てようとしています。つまり、特定の割合が不明 (0) であると想定しています。父親ごとの子供の総数に基づいて、父親ごとの行数に応じて割り当てたいと思います。以下のデータでは、スクリプトがたとえば g、k、u、x の 25% を 0 に置き換えることを期待しています。


child   father mother
1          g      m1
2          g      m2
3          g      m1
4          g      m2
5          g      m1
6          g      m2
7          k      m1
8          k      m2
9          k      m1
10          k      m2
11          u      m1
12          u      m2
13          u      m1
14          u      m2
15          u      m1
16          x      m2
17          x      m1
18          x      m2
19          x      m1
20          x      m2
4

1 に答える 1

1

これは の各グループ内を検索しfather、ケースの 25% が 0 に設定されたベクトルを返します。これを現在の変数の上に保存すると、希望する結果が得られることが期待されます。

test <- read.table(textConnection("child father mother
1 g  m1
2 g  m2
3 g  m1
4 g  m2
5 g  m1
6 g  m2
7 k  m1
8 k  m2
9 k  m1
10 k  m2
11 u  m1
12 u  m2
13 u  m1
14 u  m2
15 u  m1
16 x  m2
17 x  m1
18 x  m2
19 x  m1
20 x  m2"),
header=TRUE,stringsAsFactors=FALSE)

控えめにするために、25% を切り捨てます。または適切な場合floorに置き換えることができます。roundceil

test$father <- unlist(
    ave(test$father,test$father,
           FUN=function(x) {
               x[1:floor(length(x)*0.25)] <- 0
               x
           }
    )
)

結果:

test
> test
   child father mother
1      1      0     m1
2      2      g     m2
3      3      g     m1
4      4      g     m2
5      5      g     m1
6      6      g     m2
7      7      0     m1
8      8      k     m2
9      9      k     m1
10    10      k     m2
11    11      0     m1
12    12      u     m2
13    13      u     m1
14    14      u     m2
15    15      u     m1
16    16      0     m2
17    17      x     m1
18    18      x     m2
19    19      x     m1
20    20      x     m2
于 2012-09-10T22:19:04.660 に答える