0

R で一部のデータを操作できません。情報を含むデータ フレームがあります。お客様のお取引に関すること。次のように最小日付を抽出します。

hold <- (lapply(with(train_train, split(date,id)),min)) # minimum date

次のリストを教えてください:

head(hold)

#$`15994113`
#[1] "2012-03-02"
#
#$`16203579`
#[1] "2012-03-02"
#
#$`17472223`
#[1] "2012-03-22"

次に、各 ID に対して返された日付を取得し、それを各 ID に関連する他の変数を含むデータ フレームにマージします。次のようにしようとしました。

hold <- as.data.frame(unlist(hold))
hold <- as.data.frame(cbind(row.names(hold),hold[,1]))
names(hold) <- c('id', 'mindate')
transactions.temp <- merge(x = transactions.pro, y = hold, by = 'id')

ただし、バインドは日付形式を破壊し、これを次のようなメイン データセットにマージできるようにする「id」「mindate」のデータ構造を取得する方法がわかりません。

> head(transactions.pro)
           id totaltransactions totalspend        meanspend
1:  100007447              1096    6644.88 6.06284671532847
2:  100017875               348     992.29 2.85140804597701
3:  100051423               646    2771.43 4.29013931888545
4: 1000714152              2370   10509.08 4.43421097046414
5: 1002116097              1233    4158.51 3.37267639902676
6: 1004404618               754    2978.15 3.94980106100796

アドバイスをいただければ幸いです。ありがとう!

4

2 に答える 2