17

glmnet を使用してモデルを作成しようとしています (現在、ラムダ値を見つけるために cv を使用しています)、エラーが発生していますNA/NaN/Inf in foreign function call (arg 5)。NA を持つすべてのデータ ポイントを削除すると、コマンドが正常に実行されるため、これはデータ セットの NA 値と関係があると思います。

glmnetはNA 値を処理できるという印象を受けました。エラーの原因がわかりません:

> res <- cv.glmnet(features.mat, as.factor(tmp[,"outcome"]), family="binomial")
Error in lognet(x, is.sparse, ix, jx, y, weights, offset, alpha, nobs,  : 
  NA/NaN/Inf in foreign function call (arg 5)

データセットは次のようになります。

> head(features.mat)
6 x 8 sparse Matrix of class "dgCMatrix"
   a b   c  e  f  g  h i
1  1 1 138 NA NA 15 NA .
4  1 3 171 NA NA 17 NA .
7  1 1 156 NA NA  5 NA .
8  1 4  97 NA NA  7 NA .
9  1 1 219 NA NA 11 NA .
10 1 . 263 NA NA 20 NA .
> head(as.factor(tmp[,"outcome"]))
[1] 0 0 0 0 0 0
Levels: 0 1
4

4 に答える 4

17

glmnet は NA 値を処理できないようです!

于 2014-02-18T20:26:21.523 に答える