問題タブ [variable-selection]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 変数選択のステップ関数が機能しない
step()
Rの関数を使用して変数選択を行おうとしていますが、エラーが発生し続けます。すると、以前のような基本的な機能がなくなっていることがわかりましたstep()
。lmerTest
混合モデル用のパッケージにはステップ機能があります。
これに代わる機能を知っている人はいますか?
エラーのスクリーンショットは次のとおりです。
r - R: 多重共線性テスト出力の出力に基づいて、多重共線変数を削除/ドロップします
32 個の変数と 48 個の観測値のデータセットがあります (サブスクリプションによるデータ収集の段階にあるため、観測値は増加します)。このデータセットは多重共線性が高いため、Farrar – Glauber Test を導入しました。テストの個々の尺度 (idiags) には、変数が多重共線性であるかどうかを示す値 0 と 1 を持つ Klein と呼ばれるパラメーターがあります。Klien の値に基づいて、メイン データセットから列を削除する必要があります。データセット imcdiag_idiagval のクライン値に基づいて、メイン データセット (model_df) から削除/ドロップする方法に行き詰まっています。
以下の私のサンプルコード、 model_df0 : ターゲット変数のないデータセット model_df: ターゲット変数のあるデータセット
32 個の変数のうち、Klein で 1 の値には多重共線性があります。したがって、それらを削除する必要があります
r - R の ExtremeBounds パッケージを使用して、100 を超える変数のデータセットに極値境界分析を適用するにはどうすればよいですか?
1794 の観測値を持つ 107 の変数で構成されるデータセットがあります。106 の変数のどれが従属変数とロバストに相関しているかを決定するために、エクストリーム バウンド分析を実装したいと考えています。それぞれが異なるモデル仕様を持つ広範囲の回帰です。決定的なモデルには、最も堅牢な変数を選択するつもりです。
Marek Hlavac の ExtremeBounds パッケージを使用しています。次のコード行を実行しようとしています。
従属変数
はダミーです。そのため、家族の引数で二項リンクを選択します。
reg.fun 引数は、R が OLS 回帰を実行するのではなく、ロジットなどの一般化された線形モデルを実行するためのものです。
k 引数を 0:106 に設定しました。つまり、変数が最大 106 個の変数を含むモデル間でロバストかどうかを判断したいということです。ただし、推定するモデルの総数は膨大になります。1 つの説明変数のみを含む 106 の可能なモデルがあります。2 つの説明変数を含むモデルは 106!/[2!(104!)] 個あります。引数 draws=100 は、モデルの数を 100 に制限します。106 個の変数の組み合わせとして記述できるモデルの膨大なプールからランダムに選択された 100 個のモデルのみを実行します。
引数 draws を使用すると、このタスクが私のコンピューターで可能になると思いますが、次のエラー メッセージが表示されます。
私はすでにドキュメントをチェックしましたが、どの変数がフリーで、どの変数がフォーカスで、どの変数が疑わしいかを指定していないため、106 個の変数すべてがフォーカスと見なされます。一部のフォーカス変数がデータフレームにないことが示唆される理由がわかりません。何が間違っているのか、どうすれば意図したことを実行できるのか教えてください。