21

と呼ばれる次のデータフレームがありますsurge

MeshID    StormID Rate Surge Wind
1         1412 1.0000E-01   0.01 0.0
2         1412 1.0000E-01   0.03 0.0
3         1412 1.0000E-01   0.09 0.0
4         1412 1.0000E-01   0.12 0.0
5         1412 1.0000E-01   0.02 0.0
6         1412 1.0000E-01   0.02 0.0
7         1412 1.0000E-01   0.07 0.0
1         1413 1.0000E-01   0.06 0.0
2         1413 1.0000E-01   0.02 0.0
3         1413 1.0000E-01   0.05 0.0

次のコードを使用して、嵐ごとのサージの最大値を見つけました。

MaxSurge <- data.frame(tapply(surge[,4], surge[,2], max))

戻り値:

1412 0.12
1413 0.06

MeshIDこれはすばらしいことですが、サージが最大になるポイントの値も含めたいと思います。おそらく を使用できることはわかっていますwhich.maxが、これを実行する方法がわかりません。私はRプログラミングに非常に慣れていません。

4

4 に答える 4

14

そしてdata.tableエレガンスをコーディングするためのソリューション

library(data.table)
surge <- as.data.table(surge)
surge[, .SD[which.max(surge)], by = StormID]
于 2012-10-04T03:31:32.780 に答える
13

ここに別のdata.tableソリューションがありますが、.SDに依存していません(したがって10倍高速です)

surge[,grp.ranks:=rank(-1*surge,ties.method='min'),by=StormID]
surge[grp.ranks==1,]
于 2012-10-18T12:48:26.327 に答える
7

最大で 2 つの data.points がある場合which.max、最初の 1 つだけを参照します。より完全な解決策には、次のものが含まれrankます。

# data with a tie for max  
surge <- data.frame(MeshID=c(1:7,1:4),StormID=c(rep(1412,7),
rep(1413,4)),Surge=c(0.01,0.03,0.09,0.12,0.02,0.02,0.07,0.06,0.02,0.05,0.06))

# compute ranks  
surge$rank <- ave(-surge$Surge,surge$StormID,FUN=function(x) rank(x,ties.method="min"))
# subset on the rank  
subset(surge,rank==1)
   MeshID StormID Surge rank
4       4    1412  0.12    1
8       1    1413  0.06    1
11      4    1413  0.06    1
于 2012-10-03T13:08:31.400 に答える
6

これがplyrソリューションです。私がそうしなければ誰かがそれを言うからです...

R> ddply(surge, "StormID", function(x) x[which.max(x$Surge),])
  MeshID StormID Rate Surge Wind
1      4    1412  0.1  0.12    0
2      1    1413  0.1  0.06    0
于 2012-10-03T11:23:27.210 に答える