「ユーザー」ごとに X 行を含むデータフレームがあります。X はユーザー間で一定ではありません。私がやりたいことは、乱数を生成して新しい列を埋めることができるようにすることですが、「ユーザー」ごとに、乱数はそのユーザーに対応するすべての行で同じです。たとえば、データは次のようになります。
user feature1 feature2
1 "A" "B"
1 "L" "L"
1 "Q" "B"
1 "D" "M"
1 "D" "M"
1 "P" "E"
2 "A" "B"
2 "R" "P"
2 "A" "F"
3 "X" "U"
... ... ...
次のような新しい列を生成したいと思います。
user feature1 feature2 new_rand
1 "A" "B" 0.183
1 "L" "L" 0.183
1 "Q" "B" 0.183
1 "D" "M" 0.183
1 "D" "M" 0.183
1 "P" "E" 0.183
2 "A" "B" 0.971
2 "R" "P" 0.971
2 "A" "F" 0.971
3 "X" "U" 0.302
... ... ...
私が行った最初のアプローチは基本的に使用することでしたs <- split(df, df$user)
が、データフレームには膨大な数のユーザーが含まれており、これはおそらく非常に非効率的な方法だと思います.
どうもありがとう。