1

次のような「train」というデータフレームがあります

ID ResourceID
1  237
2  237
3  1845
4  739
.  .
.  .
.  .

特定のリソースの相対頻度を取得するにはどうすればよいですか?

4

2 に答える 2

7

を調べる必要がありますprop.table。簡単な例を次に示します。

# Your sample data
mydf <- structure(list(ID = 1:4, ResourceID = c(237L, 237L, 1845L, 739L)), 
                  .Names = c("ID", "ResourceID"), class = "data.frame", 
                  row.names = c(NA, -4L))
mydf
#   ID ResourceID
# 1  1        237
# 2  2        237
# 3  3       1845
# 4  4        739
prop.table(table(mydf$ResourceID))
# 
#  237  739 1845 
# 0.50 0.25 0.25 
于 2013-06-30T04:22:32.003 に答える
3

table()関数は頻度を与えるので、table(train$ResourceID)リソースの頻度を与えます。相対頻度を取得するには、次のようにケースの総数で割ります。table(train$ResourceID)/nrow(train)

些細な例:

> table(train$label)

 one zero 
 510  490 
> table(train$label)/nrow(train)

 one zero 
0.51 0.49 
于 2013-06-30T03:56:11.967 に答える