3

コンピューターの 4 つのコアを使用したいので、データフレームを 4 つの等しい部分に分割したいと思います。

これは私がしました :

df2 <- split(df, 1:4)
unsplit(df2, f=1:4)

そしてそれ

df2 <- split(df, 1:4)
unsplit(df2, f=c('1','2','3','4')

しかし、分割解除機能は機能しませんでした。これらの警告メッセージが表示されます

1: In split.default(seq_along(x), f, drop = drop, ...) :
  data length is not a multiple of split variable
...

理由はわかりますか?

4

2 に答える 2

1

R 言語の「分割」の例では . . .

aq <- airquality
g <- aq$Month
l <- split(aq,g)

「スケール」機能の実行後

l <- lapply(l, transform, Ozone = scale(Ozone))

R の歴史のある時点で、関数「scale」は、変更中の列に追加の属性を追加しなかったと推測しています。

  ..$ Ozone  : num ...
  .. ..- attr(*, "scaled:center")= num 29.4
  .. ..- attr(*, "scaled:scale")= num 18.2

ここに見られるように。. .

> str(l)
List of 5
 $ 5:'data.frame':      31 obs. of  6 variables:
  ..$ Ozone  : num [1:31, 1] 0.782 0.557 -0.523 -0.253 NA ...
  .. ..- attr(*, "scaled:center")= num 23.6
  .. ..- attr(*, "scaled:scale")= num 22.2
  ..$ Solar.R: int [1:31] 190 118 149 313 NA NA 299 99 19 194 ...
  ..$ Wind   : num [1:31] 7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ...
  ..$ Temp   : int [1:31] 67 72 74 62 56 66 65 59 61 69 ...
  ..$ Month  : int [1:31] 5 5 5 5 5 5 5 5 5 5 ...
  ..$ Day    : int [1:31] 1 2 3 4 5 6 7 8 9 10 ...
 $ 6:'data.frame':      30 obs. of  6 variables:
  ..$ Ozone  : num [1:30, 1] NA NA NA NA NA ...
  .. ..- attr(*, "scaled:center")= num 29.4
  .. ..- attr(*, "scaled:scale")= num 18.2
  ..$ Solar.R: int [1:30] 286 287 242 186 220 264 127 273 291 323 ...
  ..$ Wind   : num [1:30] 8.6 9.7 16.1 9.2 8.6 14.3 9.7 6.9 13.8 11.5 ...
  ..$ Temp   : int [1:30] 78 74 67 84 85 79 82 87 90 87 ...
  ..$ Month  : int [1:30] 6 6 6 6 6 6 6 6 6 6 ...
  ..$ Day    : int [1:30] 1 2 3 4 5 6 7 8 9 10 ...
 $ 7:'data.frame':      31 obs. of  6 variables:
  ..$ Ozone  : num [1:31, 1] 2.399 -0.32 -0.857 NA 0.154 ...
  .. ..- attr(*, "scaled:center")= num 59.1
  .. ..- attr(*, "scaled:scale")= num 31.6
  ..$ Solar.R: int [1:31] 269 248 236 101 175 314 276 267 272 175 ...
  ..$ Wind   : num [1:31] 4.1 9.2 9.2 10.9 4.6 10.9 5.1 6.3 5.7 7.4 ...
  ..$ Temp   : int [1:31] 84 85 81 84 83 83 88 92 92 89 ...
  ..$ Month  : int [1:31] 7 7 7 7 7 7 7 7 7 7 ...
  ..$ Day    : int [1:31] 1 2 3 4 5 6 7 8 9 10 ...
 $ 8:'data.frame':      31 obs. of  6 variables:
  ..$ Ozone  : num [1:31, 1] -0.528 -1.284 -1.108 0.455 -0.629 ...
  .. ..- attr(*, "scaled:center")= num 60
  .. ..- attr(*, "scaled:scale")= num 39.7
  ..$ Solar.R: int [1:31] 83 24 77 NA NA NA 255 229 207 222 ...
  ..$ Wind   : num [1:31] 6.9 13.8 7.4 6.9 7.4 4.6 4 10.3 8 8.6 ...
  ..$ Temp   : int [1:31] 81 81 82 86 85 87 89 90 90 92 ...
  ..$ Month  : int [1:31] 8 8 8 8 8 8 8 8 8 8 ...
  ..$ Day    : int [1:31] 1 2 3 4 5 6 7 8 9 10 ...
 $ 9:'data.frame':      30 obs. of  6 variables:
  ..$ Ozone  : num [1:30, 1] 2.674 1.928 1.721 2.467 0.644 ...
  .. ..- attr(*, "scaled:center")= num 31.4
  .. ..- attr(*, "scaled:scale")= num 24.1
  ..$ Solar.R: int [1:30] 167 197 183 189 95 92 252 220 230 259 ...
  ..$ Wind   : num [1:30] 6.9 5.1 2.8 4.6 7.4 15.5 10.9 10.3 10.9 9.7 ...
  ..$ Temp   : int [1:30] 91 92 93 93 87 84 80 78 75 73 ...
  ..$ Month  : int [1:30] 9 9 9 9 9 9 9 9 9 9 ...
  ..$ Day    : int [1:30] 1 2 3 4 5 6 7 8 9 10 ...

しかし、今ではそれらの属性を追加します

  ..$ Ozone  : num ...
  .. ..- attr(*, "scaled:center")= num 29.4
  .. ..- attr(*, "scaled:scale")= num 18.2

非常に単純な「unsplit」機能は、これらの属性を処理するようにプログラムされていません。

> unsplit(l,g)
Error in xj[i, , drop = FALSE] : (subscript) logical subscript too long

(直接的で単純な) 解決策は、これらの属性を取り除くことです。

attributes(l[[1]]$Ozone) <- NULL
attributes(l[[2]]$Ozone) <- NULL
attributes(l[[3]]$Ozone) <- NULL
attributes(l[[4]]$Ozone) <- NULL
attributes(l[[5]]$Ozone) <- NULL

その後、もう一度分割を解除してみてください。

str( unsplit(l,g) )

> str( unsplit(l,g) )
'data.frame':   153 obs. of  6 variables:
 $ Ozone  : num  0.782 0.557 -0.523 -0.253 NA ...
 $ Solar.R: int  190 118 149 313 NA NA 299 99 19 194 ...
 $ Wind   : num  7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ...
 $ Temp   : int  67 72 74 62 56 66 65 59 61 69 ...
 $ Month  : int  5 5 5 5 5 5 5 5 5 5 ...
 $ Day    : int  1 2 3 4 5 6 7 8 9 10 ...

だから、今それは動作します。

アンドレ・ミクレツ

于 2016-10-13T05:49:04.073 に答える