4

特にコードが実行されるたびに異なる出力を与える可能性があるため、少し奇妙なことに遭遇しました。一言で言えば、最後の値よりも大きな値を行に設定するために誤って使用setしていましたが、何もしない代わりにset負の長さを作成しましたdata.table

library(data.table)

dt<-data.table(id=1:5, var=rnorm(5)) # normal example

set(dt, 6L, 1L, 3L) # doesn't set anything as expected.
dt
#
# now my real data, after I found the error in my code (incorrect row number in set)
#
dt1 <- data.table(ID = "29502509", FY = 2012, VAR = 61067.5442975645, 
                      startDate = structure(15062L, class = c("IDate", "Date")), 
                      endDate = structure(15429L, class = c("IDate", "Date")), 
                      start = "1750", end = "2404",
                      date = structure(15461L,class = c("IDate", "Date")),
                      DESCR = "JOB", NOTE = "NEW")

set(dt1, 12L, 3L, 62385.6516144086)
str(dt1)
Classes ‘data.table’ and 'data.frame':  1 obs. of  10 variables:
 $ ID       : chr "29502509"
 $ FY       : num 2012
 $ VAR      : num 61068
 $ startDate: IDate, format: "2011-03-29"
 $ endDate  :
Error in do.call(str, c(list(object = obj), aList, list(...)), quote = TRUE) : 
  negative length vectors are not allowed
> sapply(dt1, length)
        ID         FY        VAR  startDate    endDate      start        end       date 
         1          1          1          1 -637110831          1          1          1 
     DESCR       NOTE 
         1          1 
> dput(dt1)
structure(list(ID = "29502509", FY = 2012, VAR = 61067.5442975645, 
    startDate = structure(15062L, class = c("IDate", "Date")), 
    endDate = structure(, class = c("IDate", "Date")), start = "1750", # HERE
    end = "2404", date = structure(15461L, class = c("IDate", 
    "Date")), DESCR = "JOB", NOTE = "NEW"), .Names = c("ID", 
"FY", "VAR", "startDate", "endDate", "start", "end", "date", 
"DESCR", "NOTE"), row.names = c(NA, -1L), class = c("data.table", 
"data.frame"), .internal.selfref = <pointer: 0x0000000000130788>)

上で述べたようdt1 <- data.table(...に、data.table の作成から まで、コード全体を何度か実行する必要があるかもしれませset(dt1,...ん。-実行します。何か案が?dt1 <- data.table(...

編集:

具体的に言うと、異なる結果と言うときは、(予想どおり) 何もしないこともありますが、ほとんどの場合、常に the Date負の長さの列を作成し、負の行全体data.tableを作成することもあります。さらに、最後の 2 つのケース (単一列または全体data.table) では、負の長さは常に-637110831

4

1 に答える 1

3

列に割り当てられたメモリを超えた書き込みによるメモリ破損のようです。

これはassignin を呼び出しますassign.c。バージョン 1.8.8 から、assign.c:434:

434             default :
435                 for (r=0; r<targetlen; r++)
436                     memcpy((char *)DATAPTR(targetcol) + (INTEGER(rows)[r]-1)*size, 
437                            (char *)DATAPTR(RHS) + (r%vlen) * size,
438                            size);

このコードに到達します (これは当てはまりません)。この時点で:

(gdb) p INTEGER(rows)[0]
$21 = 12
(gdb) p size
$23 = 8
于 2013-06-03T20:44:28.030 に答える