次のような「train」というデータフレームがあります
ID ResourceID
1 237
2 237
3 1845
4 739
. .
. .
. .
特定のリソースの相対頻度を取得するにはどうすればよいですか?
次のような「train」というデータフレームがあります
ID ResourceID
1 237
2 237
3 1845
4 739
. .
. .
. .
特定のリソースの相対頻度を取得するにはどうすればよいですか?
を調べる必要がありますprop.table
。簡単な例を次に示します。
# Your sample data
mydf <- structure(list(ID = 1:4, ResourceID = c(237L, 237L, 1845L, 739L)),
.Names = c("ID", "ResourceID"), class = "data.frame",
row.names = c(NA, -4L))
mydf
# ID ResourceID
# 1 1 237
# 2 2 237
# 3 3 1845
# 4 4 739
prop.table(table(mydf$ResourceID))
#
# 237 739 1845
# 0.50 0.25 0.25
table()
関数は頻度を与えるので、table(train$ResourceID)
リソースの頻度を与えます。相対頻度を取得するには、次のようにケースの総数で割ります。table(train$ResourceID)/nrow(train)
些細な例:
> table(train$label)
one zero
510 490
> table(train$label)/nrow(train)
one zero
0.51 0.49