問題タブ [model-comparison]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
validation - 標準誤差を増やしながらAICを減らす
適切なモデルの選択に問題があります。さまざまな変数 (共変数とダミー変数) を持つモデルがあります。私はモデルの最良のつかみ取りを見つけようとしていたので、最初にモデルを AIC と比較することから始めました。このことから、すべての変数がモデル内にとどまることを許可したときに最小 AIC に達したことがわかりました (束全体がすべてのダミーと相互作用します)。モデルの要約を計算すると、すべての効果はまったく重要ではなく、その標準. エラーが非常に多くなります。「最良の」(AIC 上での) モデルと、インタラクションを備えたより小さなモデルを比較するとき、私は少し混乱しました。小さいモデルの標準誤差は小さく、p 値は良好でした...しかし、AIC は大きいモデルに比べて高くなっています。何が問題なのですか?オーバースペック?
これを処理する方法がまったくわからないので、本当に助けが必要です!
どうもありがとう
r - R で 1 つ以上の因子変数を使用した網羅的なモデル選択
多数の説明変数 (変数間の交互作用項を含む) に基づいて線形モデルを構築しようとしていますが、そのうちの 2 つは因子変数です。regsubsets() または jumps() で factor 変数を使用すると、エラーが発生します。徹底的なモデル選択を試みるときに因子変数を組み込むために使用できる別の関数またはパッケージはありますか?
ありがとうございました
ジェームズ
r - 加重非線形回帰 (nls) による AIC
加重モデルと非加重モデルの偏差を AIC 値と比較すると、いくつかの不一致が発生します。一般的な例 (「nls」から):
これは重み付けされていない適合です。「nls」のコードでは、「nls」がベクトルを生成することがわかりますwts <- rep(1, n)
。
加重フィットの場合:
ここでは、2 つの反復で 8 つの濃度のそれぞれに増加する重みを割り当てます。
今deviance
私は得る:
加重適合の逸脱度が大幅に高い(適合が悪い)ことを教えてくれます。
今AIC
(またはBIC
)で私は得る
これは、2番目の適合が桁違いに優れていることを示しています(AICが低い)。なんでそうなの?
AIC
教科書にある残差二乗和に基づいて定義すると
私は得る
stats:::AIC.logLik
これは、対数尤度に基づく上記の AIC ( ) と同じ値です。
しかし
これはより高く、2 番目のモデルのより高い逸脱にも完全に適合します。
誰でも私を啓発できますか?加重フィッティングの場合、「nls」モデルの標準 AIC 実装は適用されませんか?
乾杯、アンドレイ
statistics - RMSE と相関係数による 2 つの回帰モデルの比較
相関係数が 87 で RMSE が 0.045 の 2 つの回帰モデルと、相関係数が 93 で RMSE が 0.055 の回帰モデルがあります。将来のケースを予測するためのより良いモデルはどれですか? または、相関係数と RMSE のどちらが回帰モデルの評価に適していますか? ありがとう。
r - RでガンマGLMを使用してAICによるモデル選択を行うにはどうすればよいですか?
glm() のドキュメントで説明されているように、glm() によって返される値の aic コンポーネントは有効な AIC ではありません。
ガウス、ガンマ、および逆ガウス ファミリの場合、分散は残留偏差から推定され、パラメータの数は係数の数に 1 を加えた数になります。ガウス ファミリの場合、分散の MLE が使用されるため、これは AIC の有効な値ですが、ガンマおよび逆ガウス ファミリの場合はそうではありません。
したがって、有効な AIC を別の方法で取得する必要があります。
r - 2 つの時点で構築された回帰モデルの比較
同じグループの被験者、変数を使用して構築された 2 つの重線形回帰モデルがあります。唯一の違いは時点です。1 つはベースライン データで、もう 1 つはしばらくしてから取得されます。2 つのモデル間に統計的有意性があるかどうかを比較したいと思います。モデルを比較するときに、AIC を使用する方が p 値よりも優れている可能性があるという記事を見たことがあります。
私の質問は、RでextractAICを使用してAICを純粋に比較すること、またはanova(lm)を取得することは理にかなっていますか?
statistics - モデル比較における AIC 値
AIC を使用して 2 つのモデルを比較していました。しかし、両方の AIC 値が小さすぎることに気付きました (-4752.66、もう一方はそれに近い)。それが正常なのか、それとも計算中に何か間違ったことをしたのだろうかと思っていました。
r - 2 つのモデル間の Anova 分析で R の p 値が生成されない場合、それはどういう意味ですか?
私は2つの小さなデータセットを持っています:
と
R で anova() 構文を使用してこれら 2 つのモデルを比較しようとすると (以下を参照)、p 値を生成できません。問題を引き起こしているのが 2 つのデータ セットの性質であるとは確信していません (ただし、2 つのデータ セットの構造の正確な違いにも興味があります)。 . ありがとうございました!
モデル比較構文:
r - biglm と lm で AIC が異なる
biglm を使用して、大規模なデータセット (約 60,000,000 行) で線形回帰を実行しようとしています。機種選定にAICを使いたい。しかし、より小さなデータセットで biglm を使用しているときに、biglm によって返される AIC 変数が lm によって返される変数と異なることを発見しました。これは、biglm ヘルプの例にも当てはまります。
誰かがここで何が起こっているのか説明してもらえますか? biglm で生成された AIC は、同じデータセットで biglm モデルを比較するために安全に使用できますか?