r - R で集計された平均値を含む列を作成するにはどうすればよいですか?

Question

R では、次のようなデータフレームに大量のデータがあります。

state | zip   | value
______|_______|______
CA    | 94555 | 18
CA    | 94556 | 5
OH    | 12345 | 22
OH    | 12346 | 10

等々。

その状態の平均「値」をリストする各行に列を追加したい。

" " 経由で手段のデータフレームを取得できます(aggregate(data$value, list(State = data$state), mean))。これにより、各州に 1 つずつ、50 行のデータフレームが得られます。しかし、元のデータフレームに戻って、その州に属する行に州の平均を入れる必要があります。

どうすればこれを行うことができますか？

score 6 · Accepted Answer

そしてdata.table解決策

library(data.table)
DT <-  data.table(state = c("CA","CA","OH","OH"), 
                   zip = c(94555,94556,12345,12346), 
                   value = c(18, 5, 22, 10))

DT[, mean := mean(value), by = state]

##    state   zip value mean
## 1:    CA 94555    18 11.5
## 2:    CA 94556     5 11.5
## 3:    OH 12345    22 16.0
## 4:    OH 12346    10 16.0

score 4 · Accepted Answer

マージコマンドを使用します。例：

df = data.frame(state=c('CA','CA','OH','OH'),zip=c(94555,94556,12345,12346),value=c(18,5,22,10))
df2 = aggregate(df$value,list(state=df$state),mean)
merge(df,df2)

score 4 · Accepted Answer

使用できますplyr

library(plyr)
df<-data.frame(state=c("CA","CA","OH","OH"),zip=c(94555,94556,12345,12346),value=c(18,5,22,10))
out<-ddply(df,.(state),transform,mean=mean(value))
> out
  state   zip value mean
1    CA 94555    18 11.5
2    CA 94556     5 11.5
3    OH 12345    22 16.0
4    OH 12346    10 16.0

mnel で指摘されているように、mutate使用することもでき、より高速になるはずです

ddply(df,.(state),mutate,mean=mean(value))

score 3 · Accepted Answer

これは、忘れられたave関数を使用するのに最適な時期です。

dat <- data.frame(state = c('CA','CA','OH','OH'), 
    zip = c('94555','94556','12345','12346'), 
    value = c(18,5,22,10))

dat$mean <- ave(dat$value, dat$state, FUN=mean)

score 2 · Accepted Answer

ここで重要なのはマージです。

data <- data.frame(state = c('CA','CA','OH','OH'), zip = c('94555','94556','12345','12346'), value = c(18,5,22,10))
aggs <- aggregate(data$value, list(State = data$state), mean)
names(aggs) <- c('state','avg')
merge(data, aggs, by = 'state')

r - R で集計された平均値を含む列を作成するにはどうすればよいですか?

5 に答える 5

Related

Reference