-4

昨年の金曜日に完了した週次レポートを組み合わせて Excel にまとめた次のデータがあります。各行は、開いているアカウントです。

location code  days.open     report.date 
LA       C1    186          8/2/2013    
SF       C2    186          8/2/2013    
SF       M     18           8/2/2013    
LA       C1    130          7/26/2013    
HB       M     30           7/26/2013    
LA       F     2            7/19/2013    
HB       F     188          7/19/2013    
LA       C3    90           7/12/2013    
LB       F     30           7/12/2013    
LB       F     36           7/12/2013    
SF       M     94           7/12/2013    
NB       C1    6            7/5/2013    
HB       M     18           7/5/2013    
LB       M     35           6/28/2013    
SD       C3    201          6/28/2013    
SD       F     69           6/21/2013    

100 万件以上のエントリがあります。

時系列に R を使用するのはこれが初めてで、時系列分析用のデータを準備するのに助けが必要です。

確認したいことがいくつかあります: 1) 各レポート日付のオープン アカウント数 2) 各レポート日付の場所別のオープン アカウント数 3) コード別の各レポート日付のオープン アカウント数 4) days.open<=30 , 30 < days.open <= 60, 60 < days.open <= 90, days open > 90 に区切られたオープンアカウントの数 5) 場所によってさらに分類された #4 と同じカウント。

どこから始めればよいかよくわかりません。

あなたが提供できる助けに感謝します。

4

2 に答える 2

1

これがあなたの最後の質問に対する答えです。これを理解すれば、残りは簡単です。

library(data.table)
dt = data.table(your_df)

cuts = c(-Inf, 30, 60, 90, Inf)
dt[, .N, by = list(cut(days.open, cuts), location)]
#          cut location N
# 1: (90, Inf]       LA 2
# 2: (90, Inf]       SF 2
# 3: (-Inf,30]       SF 1
# 4: (-Inf,30]       HB 2
# 5: (-Inf,30]       LA 1
# 6: (90, Inf]       HB 1
# 7:   (60,90]       LA 1
# 8: (-Inf,30]       LB 1
# 9:   (30,60]       LB 2
#10: (-Inf,30]       NB 1
#11: (90, Inf]       SD 1
#12:   (60,90]       SD 1
于 2013-08-16T21:21:32.277 に答える