0

R.csvファイルのヘッダーの列名として600個の奇数変数が含まれているステップワイズ回帰を実行しようとしています。

回帰方程式の変数として列名を使用するにはどうすればよいですか?

私はこれに非常に慣れていないので、列をリストとして保存し、glmを実行するために使用できることを理解していません。

model.1 <- glm(x~ paste(list), family= poisson, link = logit).

どんな助けでも大歓迎です。前もって感謝します

4

1 に答える 1

3

データを正しく読み込んだ場合(たとえば、header=TRUE上記のコメントで指定されているように)、600列以上のデータフレーム(x応答用に1列、各予測変数用に1列)になります。今mydataのところこれ。その場合、@ TylerRinkerが示唆しているように、すべての予測子を含めることができます:(glm(x~.,data=mydata,family=poisson)ロジットリンクがデフォルトのリンクです。明示的に指定する場合は、と言うことができますglm(x~.,data=mydata,family=poisson(link="logit"))。次にstep、またはstepAICMASSパッケージからを使用できます。

ただし、何をしているのかわからない限り、600変数のステップワイズ回帰は、統計的な観点からは本当に、本当に、本当に悪い考えです(Googleの「ステップワイズ回帰問題」や「ステップワイズ回帰ハレル」など) ")。glmnet多くの予測子を使用してモデリングするためのより賢明なアプローチを採用しているパッケージのようなものをご覧になることを強くお勧めします。

于 2012-09-27T16:03:50.277 に答える