問題タブ [quantile-regression]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

81 問題

0 投票する

0 に答える

165 参照

r - 分位回帰フォレストからの予測間隔は、予想よりも高いカバレッジを持っていますか?

質問：

予測区間のカバレッジが予想よりも広くなる要因は何ですか? 特にrangerパッケージを使用した分位回帰フォレストに関しては?

特定のコンテキスト + REPREX:

私はパースニップとtidymodelsパッケージスイートを介して分位点回帰フォレストを使用しrangerて、予測間隔を生成しています。私はames住宅データを使用した例を確認していましたが、以下の例で、ホールドアウトデータセットで評価した場合、私の 90% 予測区間が経験的に 97% までカバーされていることに驚きました (トレーニングデータのカバー率はさらに高かった)。 .

私のモデルのパフォーマンスがトレーニングセットよりもホールドアウトセットの方が大幅に悪いことを考えると、これはさらに驚くべきことでした。

ライブラリのロード、データ、分割のセットアップ:

モデルワークフローを指定します。

トレーニングデータセットとホールドアウトデータセットで予測を行います。

トレーニングデータとホールドアウトデータの両方のカバレッジ率が、予想される 90% よりもはるかに高いことを示します (経験的には、それぞれ ~98% と ~97% のようです)。

推測:

rangerパッケージまたは分位点回帰フォレストに関する何かが、分位点を推定する方法で過度に極端であるか、何らかの形で「極端な」方向に過剰適合しています-非常に保守的な予測間隔につながります
これは、このデータセット / モデルに固有の癖です
何かが足りないか、何かが正しく設定されていません

2021-03-17T02:40:50.647

0 投票する

1 に答える

26 参照

r - R: 分位点回帰結果のプロット数を減らす

次のコードを使用すると、分位点回帰モデルの結果をプロットできます。

ただし、多くの変数があるため、下の画像に示すように、プロットは判読できません。

ラベルを含めて、18 個の変数があります。

これらの画像のいくつかを一度にプロットして読みやすくするにはどうすればよいでしょうか?

r plot quantile eps quantile-regression

2021-04-16T21:10:15.877

1 2 3 4 5 6 7 8 9 10

問題タブ [quantile-regression]

r - 分位回帰フォレストからの予測間隔は、予想よりも高いカバレッジを持っていますか?

r - R: 分位点回帰結果のプロット数を減らす

Reference