問題タブ [quantile]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 分位点回帰とp値
データセットに(Rを使用して)ガンタイル回帰を適用しています。さまざまな分位点回帰直線(taus <-c(0.05,0.25,0.75,0.95))を使用して、優れた散布図画像を簡単に作成できます。
これらの分位数のそれぞれについて(各回帰直線の統計的有意性を確認するために)p値を生成したい場合に問題が発生します。分位数の中央値(tau = 0.5)の場合、これは問題ありませんが、たとえばtau = 0.25の場合、次のエラーメッセージが表示されます。
これの理由は何でしょうか?
また、分位点回帰モデルの結果に関するp値と係数に言及することをお勧めしますか、それともプロット画像だけを表示し、その画像に基づいて結果を議論するだけで十分でしょうか?
よろしく、欲求不満の人
r - Rで列ごとの操作を実行する
人々
建物内のこれまでのゾーンの温度データがあります。次のようなものです。
私がやりたいのは、すべてのゾーンの温度の99パーセンタイルを計算することです。私はこのコマンドを実行します:
ただし、データセット内のすべての列に対して手動で行う必要があります。このコマンドですべての列(2番目の列以降)を通過する方法はありますか?
どうもありがとう。
r - 1.59 が 1.59 に等しくない理由
さて、ここで最も奇妙な問題があります。独立変数 X の特定の分位数で空間を分割するとき、従属変数 Y の平均をとっています。
私の問題は、R の分位関数が独立変数 X の範囲内の値を返さないことですが、画面に出力されたときに返される値は正しい値です。これを奇妙にしているのは、特定の分位数でのみ発生することです。
この奇妙な効果を示すサンプル コード:
皆さんが提供できる洞察をいただければ幸いです。
regression - R: 関数内で rq() を呼び出し、線形予測子を定義する
関数内でパッケージ quantreg の rq() を呼び出そうとしています。以下は、私の問題の簡単な説明です。
http://developer.r-project.org/model-fitting-functions.txtにある推奨事項に従うと、次の 行の後に設計行列が表示されます
切片を作成するために、最初の列を 1 でいっぱいにします。
ここで、rq() を呼び出すときは、次のようなものを使用する必要があります
説明変数が複数ある場合に問題が発生します。自動的に書く方法を見つける方法がわかりません:
完全な単純化されたコードは次のとおりです。
私は次のように関数を呼び出します:
そして、データを取得する方法は次のとおりです。
この場合、このコードでは、線形予測子には「処理」のみが含まれます。「追加」が必要な場合は、コード内の rq() の線形予測子に x[,3] を手動で追加する必要があります。これは自動ではなく、変数の数が不明な他のデータセットでは機能しません。誰もこれに取り組む方法を知っていますか?
どんな助けでも大歓迎です!!!
python - SciPy 変位値を取得して Stata xtile 関数と一致させる
xtile
関数を使用してベクトル内の観測値を分位数 (この場合は、標準の 5 つの分位数、20%、40%、60%、80%、100%) で分類する古い Stata コード (Stata11) を継承しました。 .
Python でコードの一部を複製しようとしており、計算に SciPy.stats.mstats 関数mquantiles()
を使用しています。
Stata のドキュメントとオンライン検索からわかる限り、Stata のxtile
方法はデータの経験的 CDF を逆にしようとし、CDF がフラットであるすべての観測値の均等加重平均を使用してカットポイントを作成します。これは、分位点を分類する方法としては非常に貧弱に思えますが、実際にはそうであり、これが正しい方法である場合もあると確信しています。
私の質問はmquantiles()
、同じ種類の慣習を壊す方法です。alphap
この関数には 2 つのパラメーターがあることに気付きましたbetap
(ドキュメントではそれらalpha
を呼び出してbeta
いますが、それを機能させるには追加の 'p' が必要です。少なくとも私はそうしています... 'alpha' と ' beta' と Python 2.7.1 および SciPy 0.10.0)。しかし、SciPy のドキュメントでも、フラットな CDF 範囲で平均を生成するこれらのパラメーターの組み合わせがあるかどうかはわかりません。
この範囲の中央値またはモードとして計算するオプションのように見えますが、平均値ではありません (アルファとベータを含むこれらの SciPy 中央値/モード オプションが、観測値またはフラット CDF 値を生成する範囲)。
これらのさまざまなオプションのあいまいさを解消し、Python で Stata 規則を再作成するのに役立つドキュメントを見つけてください。「独自の分位数関数を記述してください」というだけの回答は控えてください。第一に、それは Stata や SciPy の慣例を理解するのに役立ちません。第二に、これらの数値ライブラリを考えると、独自の分位関数を作成するのは最後の手段です。私は確かにそれを行うことができますが、必要に応じて全体的に悪いでしょう.
r - quantcut() で同順位を処理する
R 関数 quantcut() を使用して、分位数に対応するレベルを持つ因子として数値変数を再コード化しようとしています。例えば:
「Error in cut.default(x[!flag], breaks = newquant, include.lowest = TRUE, : 'breaks' are not unique」というエラーが表示されます。これは分位点に同点があるためだと思いましたが、 The documentation for quantcut 具体的には、関数がより少ない間隔を使用して同点を処理する方法の例を示しています. エラーは、ラベル引数を指定するかどうかに関係なく発生します.
アドバイスをいただければ幸いです。
編集:変数Xを入力するコードは次のとおりです:
r - R / GGPLOT2でパーセンタイル表示をプロット
2 列のデータ フレーム (x = "期間" および y = "範囲") の基本的なプロットがあります。
各期間に水平線を追加しようとしています。その下に、その期間のすべての観測値の 90% があります。(水平線である必要はありません。期間ごとの視覚的な表示で十分です)。
どんな助けでも大歓迎です。
python - リスト Python 分位数
分位問題を作成していますが、このようなことをする必要があります
間隔:
これらは変数であり、テーブルの間隔を実行しているため、それが必要です
c++ - 四分位を見つける
ユーザーがベクトルに任意の数の値を入力でき、四分位数を返すことになっているプログラムを作成しましたが、「ベクトル添え字が範囲外です」というエラーが発生し続けます。
r - 分位点回帰とp値-小数点以下の桁数を増やす
Rとパッケージを使用quantreg
して、データに対して分位点回帰分析を実行しています。
以下のように、summary関数のse(標準誤差)推定量を使用してp値にアクセスできますが、小数点以下5桁しか取得できないため、さらに多くの値が必要です。
p値の小数点以下の桁数を増やすにはどうすればよいですか?
アップデート
さて、数値結果のマトリックスを含むサブオブジェクトを選択することで、小数点以下の桁数を増やすことができます。
ただし、値が1e-12未満の場合、P値は0に丸められます(上記の出力は簡略化されたモデル例です)。@seancarmodyからの提案を適用することで、さらに多くを得ることができます。
ただし、P <1e-22の場合でも0に丸められ、「数字」が> 22に設定されている場合は、次のエラーが発生します。
prettyNum(.Internal(format(x、trim、digits、nsmall、width、3L、:invalid'digits'引数のエラー
さらに小数点以下の桁数にアクセスすることは可能ですか?