0

別の変数「Period」に基づいて、単一グループ「Actrl」の電話処理時間「Handle」の平均「ctrlmeans」を取得しようとしています。次に、データフレーム内の各人の「ハンドル」からその平均を差し引いて、新しい変数「差」を作成したいと思います。

これが私がしたことです:

> ttp1<-read.csv("ttp1.csv")

> dput(head(ttp1,12))

structure(list(NUID = structure(c(4L, 6L, 7L, 8L, 11L, 12L, 9L, 
10L, 1L, 2L, 3L, 5L), .Label = c("A000904", "A024324", "A047744", 
"A063828", "A071164", "C833344", "C833345", "C833346", "E254607", 
"Y950092", "Z952754", "Z993876"), class = "factor"), Period = c(201415L, 
201415L, 201415L, 201415L, 201415L, 201415L, 201416L, 201416L, 
201416L, 201416L, 201416L, 201416L), Queue = c(1L, 2L, 1L, 1L, 
2L, 2L, 1L, 2L, 1L, 1L, 2L, 2L), Group = structure(c(2L, 4L, 
3L, 3L, 3L, 3L, 1L, 4L, 3L, 3L, 3L, 3L), .Label = c("A", "A ", 
"ACTRL", "B"), class = "factor"), Handle = c(1013L, 699L, 425L, 
450L, 444L, 681L, 532L, 716L, 388L, 307L, 430L, 380L)), .Names = c("NUID", 
"Period", "Queue", "Group", "Handle"), row.names = c(NA, 12L), class = "data.frame")

私のコマンド:

> ctrlmeans <- with(subset(ttp1, Group=="ACTRL"), tapply(Handle, Period, mean))

> ctrlmeans


201415 201416 
500.00 376.25 

> Difference <- ttp1$Handle-ctrlmeans[ttp1$Period]

> Difference


<NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> 
  NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 

なぜNAを取得するのですか?

tapply コマンド「queue」に追加のグループ化変数を含めた場合、どうすればよいでしょうか?

4

2 に答える 2

1

ANDdplyrのグループによって Handle の平均を計算する場合に、これがパッケージでどのように機能するかの例を示すには:PeriodQueue

require(dplyr)

ctrlmeans <-                               #data.frame to store your results   
ttp1 %.%                                   #data.frane to use for analysis
  group_by(Period,Queue) %.%               #grouping variables (you can add/remove Queue if you like)
  filter(Group == "ACTRL") %.%             #use only rows where Group == "ACTRL"
  summarize(mean.Handle = mean(Handle))    #makes a summary column with means of Handle by group                                                                                     

ttp1 <- inner_join(ttp1,ctrlmeans,by=c("Period","Queue"))  #join the ctrlmeans to the ttp1 data frame
ttp1["Diff"] <- with(ttp1, Handle - mean.Handle)           #Add column for the differences

#>ttp1
#      NUID Period Queue Group Handle mean.Handle   Diff
#1  A063828 201415     1    A    1013       437.5  575.5
#2  C833345 201415     1 ACTRL    425       437.5  -12.5
#3  C833346 201415     1 ACTRL    450       437.5   12.5
#4  C833344 201415     2     B    699       562.5  136.5
#5  Z952754 201415     2 ACTRL    444       562.5 -118.5
#6  Z993876 201415     2 ACTRL    681       562.5  118.5
#7  E254607 201416     1     A    532       347.5  184.5
#8  A000904 201416     1 ACTRL    388       347.5   40.5
#9  A024324 201416     1 ACTRL    307       347.5  -40.5
#10 Y950092 201416     2     B    716       405.0  311.0
#11 A047744 201416     2 ACTRL    430       405.0   25.0
#12 A071164 201416     2 ACTRL    380       405.0  -25.0 

期間のグループのみを計算する場合はQueuefilterステートメントとステートメントからinner_join削除するだけです

于 2014-05-07T20:17:17.853 に答える
0

このメソッドは、Period が文字または要素である場合にのみ機能します。現在は数値なので、変更できます

Difference <- ttp1$Handle-ctrlmeans[as.character(ttp1$Period)]

また、この方法は 1 つのグループ化変数でのみ機能します。複数ある場合は、新しいデータセットに集計を実行してグループの概要を取得し、それをより大きな data.frame にマージして、必要な変換を行うことをお勧めします。または、より高度な data.frame 操作パッケージ ( plyr. しかし、それは実際には別の質問/問題です。

于 2014-05-07T18:46:20.517 に答える