15

私のデータセットには、多数の連続変数とダミー変数があります。glmnet を使用した分析では、ダミー変数ではなく、連続変数を標準化する必要があります。

私は現在、[0,1] の値のみを持つ列のダミー ベクトルを最初に定義し、次にscaleダミー以外のすべての列に対してコマンドを使用して、これを手動で行っています。問題は、これがあまりエレガントではないことです。

ただし、glmnet にはstandardize引数が組み込まれています。デフォルトでは、ダミーも標準化されますか? もしそうなら、ダミーをスキップするようglmnetのstandardize引数に伝えるエレガントな方法はありますか?

4

2 に答える 2

3

glmnetはダミー変数について何も知りません。これは数式インターフェイスを持たない (したがって and に触れないためmodel.frame)ためmodel.matrixです。それらを特別に扱いたい場合は、自分で行う必要があります。

于 2013-07-26T17:53:37.190 に答える