問題タブ [r-car]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - rの2つのデータセットを比較するときに信頼限界をプロットする方法は?
qqplot を使用して、生成された 2 つのデータ セットを両方ともガンマに適合させて比較しています。プロットに 95% 信頼限界を追加するにはどうすればよいですか?
r - R: VIF のカスタマイズ機能
Variance Inflation Factor を計算するループを作成しようとしています。これを実行できる関数とパッケージがあることは理解していますが、何らかのカスタマイズが必要です。
サンプルデータ
このデータフレームには 30 列 (予測子) があります。
ループの私のロジックは次のとおりです。
1) 各予測変数を他の予測変数に対して回帰し、R2 を計算します。VIF = 1/1 - R2 を使用して R2 を VIF に変換します。これにより、30 個の VIF 値が得られます。
2) VIF 値をソートします。上位の予測変数の VIF が 10 を超える場合、その予測変数を から削除しcov.mat
ます。cov.mat
現在、29 個の予測変数があります。
3) ステップ 1 を繰り返します。つまり、各予測変数を他の予測変数に対して回帰させ、VIF を再度計算します (今回は 29 VIF)。最大 VIF > 10 の場合、VIF が最も高い変数を削除し、最大 VIF <= 10 になるまで続けます。
ただし、キャッチは、特定の反復で VIF > 10 であっても、 X4 、 X6 、および X10 を保持したいということです。したがって、上記のプロセスで、反復で X4 または X6 または X10 が最高の VIF (> 10) を持つことが判明した場合、2 番目に高い VIF を持つ変数を削除します (2 番目に高い VIF も > 10 であり、X4 またはX6 または X10)。これが明確であることを願っています
上記のループが正常に機能し、最初の列が変数名で、2 番目の列が VIF 値のマトリックスがあるとします。
これは私が迷っているところです。
最初に、最も高い VIF を持つ変数が 10 を超えており、X4 または x6 と X10 の間にないかどうかを確認し、変数を dataframe から削除する必要がありますcov.mat
。最高の VIF を持つ変数 (VIF > 10 の場合) が X4 または X6 または X10 のいずれかである場合、2 行目に移動し、df
その VIF > 10 であるかどうか、および X4、X6 または X10 のいずれでもないかどうかを評価します。条件を満たしている場合は、 から削除してcov.mat
、反復を再度開始します。
編集
元のデータ フレームには 51 列と 1458 行があります。上記の関数を実行すると、エラーが発生しますthere are aliased coefficients in the model
。なぜこうなった?
r - car パッケージの II 型 Anova 関数の切片項はどこにありますか?
単純な線形モデルを構築し、パッケージのAnova()
関数を使用してタイプ II とタイプ III の両方の分散分析を実行しました。car
出力では、Type IIIAnova
には切片が含まれていますが、Type II には切片が含まれていませんAnova
。
タイプⅡ
Ⅲ型
この背後にある理由は何ですか?タイプ II 検定を使用する場合、モデルの切片が有意かどうかを判断するにはどうすればよいですか?
r - 散布図の結合
複数 (4 つ) の散布図を 1 つの図に結合しようとしています (ただし、散布図マトリックスではありません)。パッケージのscatterplot()
機能で個々の散布図を作っています。または関数car
のいずれかを使用して、4 つのプロットを組み合わせることができました。ただし、Rstudio でこれを実行しようとすると、4 つのプロットが順番に表示されます。これが R または Rstudio の新しいバージョンによるものかどうかはわかりません。layout()
par()
mtcars データセットを使用した例を次に示します。
Windows 10 で R 3.4.2、RStudio 1.1.453 を実行しています。