問題タブ [quantile]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 未知の累積関数の逆関数
私はデータファイルを扱っています。内部の観測値はランダムな値です。この場合、x の分布はわかりません (私の観察結果)。カーネル推定を適用する必要があるため、密度を推定するために関数密度を使用しています。
この後、分位点 (VaR と同様、95%) を探しているので、これを統合する必要があります。これには 2 つのオプションがあります。
これで分位数 95 の値が得られましたが、これはカーネルによって推定されたデータです。
元のデータの分位数 95 の値を知るために使用できる関数はありますか?
これは未知の分布であることに注意してください。このため、SAS にあるようなニュートンのようなノンパラメトリック法を想像したいと思います。solve()
r - R の打ち切られたガンマ分布の 95 信頼区間を見つける
[4,6] をサポートする Gamma(shape=50, scale=0.1) があります。完全なガンマ分布を F(6) - F(4) で割ることで、その分布を見つけることができました。
この切り捨てられた分布の中央の 95 信頼区間 (つまり、d2) を見つけるにはどうすればよいでしょうか?
編集:切り捨てられたガンマには、標準のガンマと同じ pdf がないことに注意してください。その理由は、切り捨てられたガンマを再正規化して、サポートを超えて 1 に統合する必要があるためです [4,6]。だから d2 = d2.full / (F(6) - F(4))
r - 分位点回帰で勾配をテストする
quantreg
一連のデータに対して分位点回帰 (95%) を実行するために、R のパッケージを使用しています。
結果を比較したい以前の分析ですでに行ったように、分位点回帰の勾配を値 1.4 に設定したいと思います。関数でlm()
これが可能である場合、固定分位数 (たとえば 0.025)offset()
を使用すると、これは機能しません。rq()
コードではエラーは発生しませんが、値 1.4 は結果に影響しません。
r - 散布図へのノンパラメトリック分位点回帰曲線
、 で散布図 (複数グループ GRP) を作成しましIV=time
たDV=concentration
。(0.025,0.05,0.5,0.95,0.975)
分位点回帰曲線をプロットに追加したかったのです。
ちなみに、これは私が散布図を作成するために行ったことです。
ここで作成したデータは、より大きなデータの小さなサブセットであるため、長方形の双曲線として近似できるように見える場合があります。しかし、独立変数と従属変数の間の数学的関係をまだ呼び出したくありません。
nlrq
パッケージからが答えかもしれないと思いますquantreg
が、変数間の関係がわからないと関数の使い方がわかりません。
科学記事からこのグラフを見つけましたが、まったく同じ種類のグラフを作成したいと考えています。
繰り返しますが、あなたの助けに感謝します!
アップデート
Test.csv サンプル データが再現できないと指摘されました。これが私のデータのサンプルです。
qcbvnonpar::evd も試してみましたが、曲線があまり滑らかに見えません。
r - Rでの`分位`関数の振る舞い
問題に取り組んでいるとき、私は何か面白いことに気づきました。正確に何が起こっているのかわかりませんが、予期していなかったことが起こります。間違えた可能性がありますが、例から始めましょう。
3つの異なる結果が得られますが、これらの結果をどのように解釈するか。これらは使用される制限ですか?
更新:私は間違った質問をしていると思います。次のことをどのように説明できますか。
r - サバイバル オブジェクトの何が問題になっていますか?
にサバイバル オブジェクトがありR
ます。
print(surv)
私にくれます
ただし、quantile(surv)
機能せず、出力されます
R
は中央値 (177) を計算できますが、他の四分位数は計算できないため、私にとっては奇妙なことです。
サバイバル オブジェクトの何が問題になっていますか?
[編集]
おそらくこれは問題の最小の例です: ドキュメント ( http://stat.ethz.ch/R-manual/R-patched/library/survival/html/quantile.survfit.html ) には、この例があります:
さて、この出力の最初の行だけを繰り返したい場合は、
@Edwinは、quantile(fit$time)
代わりに使用することを以下に提案しました
ただし、明らかに異なる結果につながります。
[終了]以下の回答はパッケージ内で
使用されていないため無視してください。ただし、組み込みの関数を使用しています。quantile.survfit
survival
R
quantile
survival
この問題を解決するには、パッケージの最新バージョンに更新してください。
これを行う
そのためには root 権限が必要な場合があることに注意してください。
r - パネル データの R での分位点回帰手順の比較 (つまり、lqmm() と rqpd())
一定の効果を持つ特定のパネル データ分位点回帰問題 (たとえば、以下を参照)の場合lqmm()
、出力を からの出力と正確に (または少なくとも厳密に) 一致させることは可能rqpd()
ですか?
以下の例とそれに続く結論/コメントを参照してください。私の結論は正しいですか?
結論/コメント
- ラムダの特定の選択について、
rqpd()
は と密接に一致するはずlqmm()
です。私はそれがいつになるべきだと思いますlambda=1/(2 cov.lqmm)
。正しい?rqpd
固定ラムダの L1 正則化に基づいているため、正確ではなく厳密に一致していると言っていますが、(??)lqmm
は L2 正則化に基づいていますが、Geraci and Bottai (2007) の手順に起因する特定のラムダに基づいています。
- 最初は、これは少なくとも nK が小さい場合、つまり nK=7 の場合には発生しません。しかし、nK が増加して 100 または 1000 になると、これら 2 つの手順は「近づくように見える」
- したがって、 の適切な使用は
lqmm
、少なくとも nK の適切な (おそらく十分な大きさの) 選択に依存するように見えます。 - の使用を検討してい
lqmm()
ました。ここでは、ペナルティ パラメータが体系的に選択されているのに対して、指定rqpd()
する必要があるからです。ただし、ラムダの特定の選択に一致lqmm()
させることができないrqpd
ため、何をしているのか理解できませんlqmm
。
r - qqlineは私が期待した線を与えません
カイ二乗分布に対してプロットされた多変量データのマハラノビス距離の多変量qqplotを実行すると、付随するqqlineは切片0と傾き1の線になると予想されます。ただし、次のコードを実行すると、次のようになります。
次の図が表示されます。
qqline(赤)は切片0と傾き1(黒)の線と同じであると予想しました。これらの2行が一致しない理由を誰かが私に説明できますか?
(私はRバージョン2.15.3(2013-03-01)を実行しています)
calculated-columns - 列 A がどの行にあるかを示す新しい列 B を作成します。
さまざまな列に関連するため、データ フレームの各レコードがどの五分位にあるかを計算したいと考えています。たとえば、mtcars データセットを使用すると、MPG_QUINTILE のような列が必要になります。その列を入力して、mpg がどの五分位に入るかを推定しました。しかし、これを自動化するにはどうすればよいでしょうか。いくつかの列に対してそれを行う必要があります。つまり、HP_QUINTILE などです。
とにかく、カスタムビルド機能を必要としないソリューションを見つけたいと思っています。また、厳密にパーセンタイルに基づく五分位と同じサイズ (ビンあたりのレコード数が同じ) の五分位が必要な場合はどうすればよいでしょうか?