私はRに比較的慣れていませんが、現在、次のようなデータフレームを持つアプリケーションに取り組んでいます:
データベース UserId 時間 日付 01 18 01.01.2016 01 18 01.01.2016 01 14 02.01.2016 01 14 02.01.2016 02 21 02.01.2016 02 08 05.01.2016 02 08 05.01.2016 03 23 05.01.2016
各行はセッションを表します。
ユーザーの最初のセッションの時間が、このユーザーのセッション数に影響を与えるかどうかを判断する必要があります。
コマンドを試しましたsummaryBy
:
library(doBy)
first_hour <- summaryBy(UserId + Hour + Date ~ UserId,
FUN=c(head, length, unique), database)
しかし、それは私に正しい結果を与えません。
ここでの私の目標はHour
、ユーザーが最初に行ったセッションを特定し、ユーザーが何回のセッションを行い、何回の異なるセッションを行ったかを決定することです。
誰かがこれを乗り越えるのを助けることができれば、それはとてもクールです!