問題タブ [quantile]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 分位点回帰 rq() から係数の上限/下限を抽出する方法
quantreg
パッケージを使用して分位点回帰から係数と上限と下限を抽出したいと思います。ヘルプ ファイルの例を次に示します。
coefficients()
係数を取得するために使用できることはわかっています。
しかし、に表示される上限/下限を取得する方法がわかりませんsummary()
。を見ましたstr(sf)
が、抽出方法がわかりませんでした。
最終的には、タウス、係数、上限/下限をデータフレームに入れてさらに処理したいと考えています。
r - 数値がどの分位ビンに収まるかを見つける方法
経験分布の分位点を見つける方法を知っています。
トレーニングセットの数が属する分位点ビンを提供する関数はありますか? この例では
分位数は 18 (見方によっては 19) になります。
stata - 独立変数に基づく分位数による分位点回帰
(投資信託の特徴の)月次観測値で分位点回帰を実行しようとしています。私がやりたいことは、各月の五分位数で観察結果を配布することです (私のデータセットは 99 か月で構成されています)。後でファンドのパフォーマンスを説明するための独立変数として使用される変数 (遅延ファンド サイズ、つまり総純資産) に基づいて五分位数を計算したいと考えています。
私がすでにやろうとしたことは、qreg
コマンドを使用することですが、それは必要な独立変数ではなく、従属変数に基づく分位数を使用しています。
さらに、xtile
コマンドを使用して五分位数を作成しようとしました。ただし、このby:
コマンドはサポートされていません。
月ごとに手動で五分位数を作成する手間を省くコマンド (の組み合わせ) はありますか?
elasticsearch - Elasticsearch の文字列フィールドの分位点集計
Elasticsearch インデックスに文字列フィールドがあり、そのフィールドでパーセンタイルまたはクォンタイル集計 (数値フィールドでうまく機能します) を実行しようとしています。
文字列フィールドに 10,000 の名前または都市があると仮定すると、予想される結果は次のようになります。
4 つのバケットを要求する場合:
用語はアルファベット順に均等に分散されていませんが、バケットはほぼ同じサイズである必要があります。2600、2400、2800、2200 の用語カウントが許容されます。
r - 分位点回帰を実行すると、R が因子変数から因子を削除するのはなぜですか?
現在、Roger Koenker のquantreg
パッケージを使用して、R で分位点回帰モデルを実行しています。5 つのレベルを持つ順序付けされたカテゴリ変数と、それぞれ 7 つ、4 つ、および 2 つのカテゴリを持つ 3 つの順序付けされていないカテゴリ変数 (曜日、季節、夜間かどうか) があります。1 から 5 までの 5 つのレベルである順序付けられたカテゴリ変数を除いて、すべてが最初は文字列としてデータ フレームに格納されます。私の変数が呼び出されるdf_prime
ことに注意してください。これは、一部の行が削除された元のデータ フレームであるためです。
回帰を実行すると、金曜日がサマリーから完全に削除され、順序付き変数である acuity_id のレベルの 1 つが削除されます。それはおそらくRがダミー変数を作成する方法に関連していますか? 何らかの理由で、seasonWinter の p 値が 1 になっていることに気付きました。
私の出力は次のとおりですが、職場の VM に R があり、コピーして貼り付けることができないため、間隔が異なります。