0

以下の例に示すように、H2o オブジェクト (3GB データ) のランダムな離散値を生成したいと考えています。

例 :

  C1    d_rand  d_status
1   0.886581278 1
2   0.117570381 0
3   0.824350102 1
4   0.356774692 0
5   0.995249866 1

以下のように R-h2o コードを書きましたが、結果を得ることができません。

> rand_num <- h2o.runif(sample_3gb, seed = 123)
> sample_3gb$d_rand = rand_num
> sample_3gb$d_rand
H2OFrame with 9227049 rows and 1 column

First 10 rows:
       d_rand
1  0.06254423
2  0.15162557
3  0.18380040
4  0.66398323
5  0.92064923
6  0.54746199
7  0.45642585
8  0.69650692
9  0.54063600
10 0.77103990
> sample_3gb$d_status = 1
> sample_3gb$d_status[sample_3gb$d_rand <= 0.3] <- 0
Error in `[<-`(`*tmp*`, sample_3gb$d_rand <= 0.3, value = 0) : 
  `i` must be missing or a numeric vector

以下は私のH2oクラスターの詳細です

R is connected to H2O cluster:
    H2O cluster uptime:         3 minutes 57 seconds 
    H2O cluster version:        3.0.0.30 
    H2O cluster name:           H2O_60331 
    H2O cluster total nodes:    2 
    H2O cluster total memory:   9.58 GB 
    H2O cluster total cores:    24 
    H2O cluster allowed cores:  24 
    H2O cluster healthy:        TRUE 

これは、R と H2o オブジェクトの間のデータ型の問題で発生していると思います。つまり、R は h2o オブジェクトの数値を数値として読み取っていません。他の条件付き操作でも同じ問題に直面しています。

4

1 に答える 1