重複の可能性:
モデル構築時の多くの変数に対する短い数式呼び出し
22,000 行と 2,000 列のデータ フレームがあります。列はサンプル、行は遺伝子です。
これらの 22,000 の遺伝子のうち、1,000 は予測変数/独立変数です。残りの 21,000 遺伝子は応答/従属変数です。
独立変数の 1,000 個すべてが従属変数の結果を予測するモデルを作成したいと思います。そのため、モデルは従属変数ごとに次のようになります。
y ~ x1 + x2 + x3 + ... + x1000
R で重回帰モデルを作成する方法は次のようになります。
example <- lm( y ~ x1 + x2 + x3, data=test)
現在、データ フレームはすべての変数が行になっていますが、データ セットを簡単に変換できます。だから私は3つの質問があります:
x1 + ... + x1000 と入力せずに 1000 個の従属変数すべてを組み込むことができるように、上記のサンプル コードをどのように記述すればよいでしょうか?
1000個の従属変数すべてをデータフレームからROWSとして抽出できるように、この方程式を書くことは可能ですか? もしそうなら、どのように?
各従属変数のすべての係数値を lm 出力から自動的に保存するにはどうすればよいでしょうか?