R
.csvファイルのヘッダーの列名として600個の奇数変数が含まれているステップワイズ回帰を実行しようとしています。
回帰方程式の変数として列名を使用するにはどうすればよいですか?
私はこれに非常に慣れていないので、列をリストとして保存し、glmを実行するために使用できることを理解していません。
model.1 <- glm(x~ paste(list), family= poisson, link = logit).
どんな助けでも大歓迎です。前もって感謝します
データを正しく読み込んだ場合(たとえば、header=TRUE
上記のコメントで指定されているように)、600列以上のデータフレーム(x
応答用に1列、各予測変数用に1列)になります。今mydata
のところこれ。その場合、@ TylerRinkerが示唆しているように、すべての予測子を含めることができます:(glm(x~.,data=mydata,family=poisson)
ロジットリンクがデフォルトのリンクです。明示的に指定する場合は、と言うことができますglm(x~.,data=mydata,family=poisson(link="logit"))
。次にstep
、またはstepAIC
MASSパッケージからを使用できます。
ただし、何をしているのかわからない限り、600変数のステップワイズ回帰は、統計的な観点からは本当に、本当に、本当に悪い考えです(Googleの「ステップワイズ回帰問題」や「ステップワイズ回帰ハレル」など) ")。glmnet
多くの予測子を使用してモデリングするためのより賢明なアプローチを採用しているパッケージのようなものをご覧になることを強くお勧めします。