-3

数値で構成される大きな (500 * 21000) データフレームがあります。このタスクを最も効率的に行うための助けが必要です。基本的に、データフレーム内のアイテムをソートし、インデックス情報を使用して O/P を取得したいと考えています。つまり、最大の要素の場合、データフレーム内のその (位置) も知りたいとします。最大/最小だけでなく、データフレーム内のすべての要素に関する情報が必要です (この場合、要約呼び出しからその情報を簡単に取得できます)。これをプログラムする方法を考えることはできますが、それを行うためのユーティリティがRに組み込まれているかどうか疑問に思っています。ありがとう!

4

1 に答える 1

0

あなたの質問は非常に漠然としています。しかし、これはあなたにとって出発点になる可能性があります。

> set.seed(345)
# Create a dataframe
> newdf <- data.frame(x = rnorm(n=100,mean=2.5,sd=2.5),
+                     y = rnorm(n=100,mean=4.5,sd=10),
+                     z = rnorm(n=100,mean=3.8,sd=1))
> head(newdf)
          x          y        z
1 0.5377296 -9.1446883 3.008115
2 1.8012141 -0.3508551 3.681795
3 2.0963553 13.3248010 4.116340
4 1.7735086  3.0728637 5.545473
5 2.3311710 -5.3247035 3.733314
6 0.9161990  9.3002188 3.763627
> 

# Find the maximum on each column
> sapply(newdf,max)
        x         y         z 
 9.545697 31.851232  5.956058 
# Find the location of maximum value on each column
> sapply(newdf,which.max)
 x  y  z 
85 87 79 
于 2013-07-13T02:32:36.350 に答える