以下にdata.frame
示すように、数値変数と因子変数で構成されています。
testFrame <- data.frame(First=sample(1:10, 20, replace=T),
Second=sample(1:20, 20, replace=T), Third=sample(1:10, 20, replace=T),
Fourth=rep(c("Alice","Bob","Charlie","David"), 5),
Fifth=rep(c("Edward","Frank","Georgia","Hank","Isaac"),4))
matrix
因子にダミー変数を割り当て、数値変数をそのままにしておく a を構築したいと考えています。
model.matrix(~ First + Second + Third + Fourth + Fifth, data=testFrame)
予想どおり、lm
これを実行すると、各因子の 1 つのレベルが参照レベルとして除外されます。matrix
ただし、すべての要因のすべてのレベルに対してダミー/指標変数を使用して構築したいと考えています。私はこの行列を構築してglmnet
いるので、多重共線性について心配していません。
model.matrix
因子のすべてのレベルに対してダミーを作成する方法はありますか?