次のようなデータセットがありますが、さらに多くの列と行があります。
a<-c("Fred","John","Mindy","Mike","Sally","Fred","Alex","Sam")
b<-c("M","M","F","M","F","M","M","F")
c<-c(40,35,25,50,25,40,35,40)
d<-c(9,7,8,10,10,9,5,8)
df<-data.frame(a,b,c,d)
colnames(df)<-c("Name", "Gender", "Age", "Score")
選択したデータのサブセットのスコアを合計できる関数を作成する必要があります。ただし、選択されたサブセットは、毎回異なる数の変数を持つ場合があります。サブセットの 1 つが&Name=="Fred"
である可能性があります。私の実際のデータ セットでは、選択したサブセットで最大 20 列が使用される可能性があるため、これを可能な限り一般化する必要があります。Gender == "M"
Age == 40
を含む sapply コマンドを使ってみましたeval(parse(text=...)
が、20,000 件程度のレコードのサンプルだけで時間がかかります。もっと速い方法があると確信しており、それを見つける手助けをいただければ幸いです。