複数の変数を持つデータセットに列がある場合、これらのダミー変数を作成するにはどうすればよいですか。
例:車の色のオプションとして、色という名前の列があるとします。赤、緑、黄色、青、ピンク、灰色です。
これらの変数を因子に変える最良の方法は何ですか。手作業でダミー変数の束を作成せずに?
編集:それで私はグレッグが推薦したことをしました、そしてこれは私が持っているものです。私はNA出力について疑問に思っていましたが、なぜそこにあるのかわかりませんでした。
> data$Trim<-factor(data$Trim)
> data$Model<-factor(data$Model)
> data$Type<-factor(data$Type)
> data=cbind(Price,Mileage,Buick,Cadillac,Chevrolet,Pontiac,SAAB,Saturn,Model,Trim,Type,Cylinder,Liter,Doors,Cruise,Sound,Leather)
> fit <- lm( Price ~ Mileage+Buick+Cadillac+Chevrolet+Pontiac+SAAB+Saturn+Model+Trim+Type+Cylinder+Liter+Doors+Cruise+Sound+Leather, x=TRUE )
> summary(fit)
次に、「係数:(21は特異点のために定義されていません)」というメッセージが表示され、一部の変数の出力はNAです。