string - R - 特定の期間の最も一般的な文字列値 (モード) を取得します

翻译自：https://stackoverflow.com/questions/17265141 2013-06-23T20:45:39.767

3560 次

ddply のモード機能を使用して、特定のユーザーの最も一般的な文字列を期間ごとに見つけたいと思っていました。

これは、この質問とこの質問に大きく関係しています。

次のようなデータセットを使用します。

Data <- data.frame(
    groupname = as.factor(sample(c("red", "green", "blue"), 100, replace = TRUE)),
    timeblock = sample(1:10, 100, replace = TRUE),
    someuser = sample(c("bob", "sally", "sue"), 100, replace = TRUE))

私が試した：

groupnameagg<- ddply(Data, .(timeblock, groupname, someuser), summarise, groupmode = mode(groupname))

しかし、それは私が期待していたものではありません。戻り値:

> head(groupnameagg$groupname)
[1] "numeric" "numeric" "numeric" "numeric" "numeric" "numeric"

タイムブロックごとにユーザーごとに最も一般的に発生するグループ名を見つけるにはどうすればよいですか? 次のような結果になります。


    timeblock   username  mostcommongroupforuser
        1          bob     red
        1          sally   red
        1          sue     green
        2          bob     green
        2          sally   blue
        2          sue     red

groupname がレベルごとに編成されている場合、各タイムブロックに存在する最高レベルを取得するにはどうすればよいですか?

string - R - 特定の期間の最も一般的な文字列値 (モード) を取得します

2 に答える 2

Related

Reference