0

2 つの時系列があります。1 つは毎日の時系列で、もう 1 つは個別の時系列です。私の場合、マージする必要がある株価と格付けがありますが、マージされた時系列が株価に従って毎日の日付を保持し、格付けがティッカーと日付によって毎日のデータに適合するようにします。単純なマージ コマンドは、正確な日付とティッカーのみを検索し、適合しないケースに NA を適用します。しかし、正確に一致するものを探して、その間の日付を最後の評価で埋めたいと思います。

 Daily time series:

         ticker       date        stock.price
          AA US Equity 2004-09-06  1
          AA US Equity 2004-09-07  2
          AA US Equity 2004-09-08  3
          AA US Equity 2004-09-09  4
          AA US Equity 2004-09-10  5
          AA US Equity 2004-09-11  6

  Discrete time series
          ticker        date        Rating Last_Rating
          AA US Equity   2004-09-08   A         A+
          AA US Equity   2004-09-11   AA        A
          AAL LN Equity  2005-09-08   BB        BB
          AAL LN Equity  2007-09-09   AA        AA-
          ABE SM Equity  2006-09-10   AA        AA-
          ABE SM Equity  2009-09-11   AA        AA-


  Required Output:

           ticker       date        stock.price  Rating
          AA US Equity 2004-09-06    1             A+
          AA US Equity 2004-09-07    2             A+
          AA US Equity 2004-09-08    3             A
          AA US Equity 2004-09-09    4             A
          AA US Equity 2004-09-10    5             A
          AA US Equity 2004-09-11    6             AA

私はあなたの助けにとても感謝しています.

4

1 に答える 1

1

多分これはあなたが望む解決策です。na.locf時系列パッケージの関数をzoo使用して、値を前方 (または後方) に繰り越すことができます。

library(zoo)
library(plyr)
options(stringsAsFactors=FALSE)

daily_ts=data.frame(
    ticker=c('A','A','A','A','B','B','B','B'),
    date=c(1,2,3,4,1,2,3,4),
    stock.price=c(1.1,1.2,1.3,1.4,4.1,4.2,4.3,4.4)
    )
discrete_ts=data.frame(
    ticker=c('A','A','B','B'),
    date=c(2,4,2,4),
    Rating=c('A','AA','BB','BB-'),
    Last_Rating=c('A+','A','BB+','BB')
    )

res=ddply(
    merge(daily_ts,discrete_ts,by=c("ticker","date"),all=TRUE),
    "ticker",
    function(x) 
        data.frame(
            x[,c("ticker","date","stock.price")],
            Rating=na.locf(x$Rating,na.rm=FALSE),
            Last_Rating=na.locf(x$Last_Rating,na.rm=FALSE,fromLast=TRUE)
            )
    )

res=within(
    res,
    Rating<-ifelse(
        is.na(Rating),
        Last_Rating,Rating
        )
    )[,setdiff(colnames(res),"Last_Rating")]

res

与える

#  ticker date stock.price Rating
#1      A    1         1.1     A+
#2      A    2         1.2      A
#3      A    3         1.3      A
#4      A    4         1.4     AA
#5      B    1         4.1    BB+
#6      B    2         4.2     BB
#7      B    3         4.3     BB
#8      B    4         4.4    BB-
于 2013-10-29T00:43:04.370 に答える