問題タブ [quantreg]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Rのquantregパッケージのanova.rq()
Rのパッケージの環境でanova.rqlist
呼び出される関数を使用して、異なる分位数 (同じ結果、同じ共変量) からの推定値を比較することに興味があります。ただし、関数の数学は私の初歩的な専門知識を超えています。異なる分位数で 3 つのモデルを当てはめたとしましょう。anova
quantreg
次に、それらを使用して比較します。
私の質問は、これらのモデルのどれが比較の基礎として使用されているかということです?
Wald テストについての私の理解(wiki エントリ)
ここで、θ^ は、提案された値 θ0 と比較される対象パラメータ θ の推定値です。
私の質問は、θ0 として選択するanova
機能は何ですか?quantreg
私の最善の推測から返された pvalue に基づいて、anova
指定された最小の分位数 (つまりtau=0.25
) を選択しているということです。中央値 ( tau = 0.5
) または を使用して得られた平均推定値を指定する方法はありますlm(y ~ x1 + x2 + x3, data)
か?
実際に生産する
その間
まったく同じ結果が得られます
anova ではモデルの順序が明らかに変更されていますが、F 値と Pr(>F) が両方のテストで同一であるというのはなぜでしょうか?
r - R と quantreg : アンバランスな残差
quantreg
パッケージを使用して指数曲線に合わせようとしています。
再現可能な例を次に示します。IRL 私は外れ値を含むはるかに複雑なデータを持っていますnls
。
sum(qr_exp$m$resid())
それ以来、約 0 になると予想していましtau = 0.5
たが、値が負であり、モデルが実際の値を過大評価する傾向があることを意味します。
ご覧のとおり、残差の合計は0に近くなっていますtau= 0.47
理由がよくわかりません。
無限の数の解が存在する可能性があり、正の残差よりも負の残差が多いという保証がないためですか?
はいの場合、これが私にとって非常に重要である場合、最善の解決策は何ですか:
- 最小絶対偏差を最小化し、最小二乗偏差を最小化しない (外れ値に対してロバストではない)
- バランスの取れた残差がありますか?
L2 ペナルティのごく一部を追加してバランスをとることは理にかなっていますか? (フーバー損失を参照)
r - OLS 勾配に対する分位点勾配の仮説検定
優れたパッケージを使用し、標準関数quantreg
を使用して分位数 0.1 と 0.9 の間の勾配が等しいという仮説をテストします。anova
model <- food ~ income
anova(rq(model,tau=0.1), rq(model,tau=0.9))
p-val がゼロの場合、q1 と q9 の勾配が等しいという帰無仮説を棄却することになります。
分位点回帰を OLS と比較するために同じ anova を実行すると、エラーが発生する
anova(rq(model,tau=0.5), lm(model))
助言がありますか?
r - 分位点回帰を当てはめます。異なる行数のテスト/トレーニング
分位点回帰をデータに適合させる必要があります。私は次のようなコードを使用します:
ただし、次のエラー メッセージが表示されます。
警告メッセージ:
'newdata' には 60000 行ありましたが、見つかった変数には 30000 行あります
トレーニング セットには 30,000 行、テスト セットには 60,000 行あります。Scriprt は機能しますが、期待される 60k ではなく、30k の値しか作成しません。Y
ここで分位点回帰を使用して、テスト セットの値をどのように当てはめ、予測できますか?
r - 分位点回帰モデルの係数が互いに有意に異なるかどうかを検定する
分位回帰モデルがあり、.25、.5、および .875 分位の効果を推定することに関心があります。私のモデルの係数は、私のモデルの根底にある実質的な実体理論に沿った方法で互いに異なります。
次のステップは、ある分位点の特定の説明変数の係数が、別の分位点の推定係数と有意に異なるかどうかをテストすることです。それをテストするにはどうすればよいですか?さらに、特定の分位点のその変数の係数が、OLS モデルの推定値と大きく異なるかどうかもテストしたいと考えています。それ、どうやったら出来るの?
私はRを含む答えを好むが、どんな答えにも興味がある.ここにいくつかのテストコードがある.
および OLS モデル:
(上記で推定された実際のモデルについて心配する必要はありません。これは説明のためのものです) たとえば、Temp の係数が分位数 .25 と .75 の間で統計的に有意に (ある特定のレベルで) 異なるかどうか、およびTemp の .25 分位点での係数は、Temp の OLS 係数と大きく異なりますか?
Rまたは統計的アプローチに焦点を当てた回答を歓迎します。
r - 分位点回帰誤差パッケージ AER
分位点回帰を実行するために、パッケージ AER のデータ HousePrices を使用しました。最初に、カテゴリ変数のダミーを作成しました。次に、基本的な ols 回帰を実行しました。これは私の回帰です:
その後
summary(myreg1)
、プロットしました。しかし、分位回帰を実行しようとすると、エラーは発生しませんでしたが、summary(myqreg1)
コマンドを使用すると警告メッセージが表示されました。
summary(myqreg1)
次に、回帰をタウに含めました:
再び警告メッセージが表示されましたが、現在は 4 つの警告があります。
私はインターネットでたくさん検索しましたが、答えが見つかりませんでした。