4

因子と数値列が混在するデータ フレームを xts に変換すると、すべてのデータが文字列に変換されます。これは因数の問題ではありませんが、数値計算では非常に厄介です。回避策はありますか?

例えば:

> x

          marketTimestamp price  id
1 2010-12-17 11:38:31.100 83.89 b-0
2 2010-12-17 11:38:31.100 83.88 b-1
3 2010-12-17 11:38:31.100 83.87 b-2
4 2010-12-17 11:38:31.300 83.91 o-0
5 2010-12-17 11:38:31.300 83.92 o-1
6 2010-12-17 11:38:31.300 83.93 o-2

> as.xts(x[,-1],as.POSIXct(x[,1]))

                    price   id   
2010-12-17 11:38:31 "83.89" "b-0"
2010-12-17 11:38:31 "83.88" "b-1"
2010-12-17 11:38:31 "83.87" "b-2"
2010-12-17 11:38:31 "83.91" "o-0"
2010-12-17 11:38:31 "83.92" "o-1"
2010-12-17 11:38:31 "83.93" "o-2"

理想的には、最初の列を数値のままにし、2 番目の列を文字列に変換したいと考えています。多数の列を持つデータセットを扱っているため、ソリューションを完全に自動化する必要があり、どれが因子でどれが数値になるかを常に予測できるとは限りません。

--

編集:

次の関数を定義することで、この問題を回避しようとしました。

to.xts <- function(data) {

    timestamp <- as.POSIXct(data[,1])
    coredata <- data[,-1]

    headers <- names(coredata)
    data.type <- c()

    for (header in headers) {
        data.type[headers==header] <- class(coredata[[header]])
    }

    data.factor  <- xts(coredata[,data.type=="factor"],timestamp)
    data.numeric <- xts(coredata[,data.type=="numeric"],timestamp)

    data.xts <- cbind(data.factor,data.numeric)

}

ただし、2 つの XTS オブジェクトをマージすると、文字列データは NA に変換されます。

> x
                    id    side 
2010-12-17 11:38:31 "b-0" "BID"
2010-12-17 11:38:31 "b-1" "BID"
2010-12-17 11:38:31 "b-2" "BID"
> y
                    price
2010-12-17 11:38:31 83.89
2010-12-17 11:38:31 83.88
2010-12-17 11:38:31 83.87
> merge(x,y)
                    id side price
2010-12-17 11:38:31 NA   NA 83.89
2010-12-17 11:38:31 NA   NA 83.88
2010-12-17 11:38:31 NA   NA 83.87
Warning message:
In merge.xts(x, y) : NAs introduced by coercion

これは XTS パッケージの既知の問題ですか、それとも間違っていますか?

4

2 に答える 2

6

xtsには数値行列が必要なため、これを行うことはできません。

于 2010-12-17T14:26:07.717 に答える
3

これは設計上の制限です。xts または Zoo は基本的に行列とインデックスであることに注意してください。データフレームとインデックスではありません。

于 2010-12-17T14:28:38.860 に答える