問題タブ [statsmodels]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Statsmodels 異分散の一貫した標準誤差に基づく平均信頼区間のプロット
この質問は、StatsModels の信頼区間と予測区間に似ていますが、ニュアンスが追加されています。
私のデータは異分散であり、statsmodels が提供する異分散の一貫した標準誤差 (HC0_se、HC1_se など) のいずれかを使用して、平均の信頼区間をプロットしたいと考えています。適合値ごとにこの情報に簡単にアクセスすることはできません (ただし、各係数の間隔を取得するのは非常に簡単です)。また、標準の平均信頼区間データと同じように、stats.outliers の結果要約テーブルに含まれていないようです。
2 つの質問:
- 誰も私がこれを行う方法を知っていますか?
- 線形回帰結果オブジェクトでも利用できる異分散一貫性のある共分散行列は、通常何を使用しますか? なぜそれが利用可能になったのですか?
どうもありがとう
python - 最尤推定の信頼区間のプロット
図書館内のさまざまな本の数の信頼区間を作成するコードを作成しようとしています (また、有益なプロットを作成します)。
私のいとこは小学校に通っており、毎週彼の先生から本が渡されます。それから彼はそれを読み、次の週に別のものを手に入れるのに間に合うようにそれを返します. しばらくすると、彼が以前に読んだ本を入手していることに気付き始め、これは時間の経過とともに徐々に一般的になりました.
図書館にある実際の本の数が N で、教師が一様に無作為に (置き換えて) 1 冊を選び、毎週あなたに渡すとします。週 t に、読んだ本を受け取った回数が x である場合、 https://math.stackexchange.com/questions/に従って図書館の本の数の最尤推定値を作成できます。 615464/how-many-books-are-in-a-library .
例: A、B、C、D、および E の 5 冊の本がある図書館を考えてみましょう。7 週間連続して [A、B、A、C、B、B、D] の本を受け取った場合、x の値 (重複の数) は、それらの各週の後に [0, 0, 1, 1, 2, 3, 3] になります。つまり、7 週間後に、既に 3 回読んだ本を受け取ったことを意味します。
尤度関数を視覚化するために (何が正しいかを理解していると仮定して)、尤度関数をプロットすると思われる次のコードを作成しました。最大値は約 135 です。これは、上記の MSE リンクによると、実際には最尤推定値です。
出力は次のようになります
私の質問は次のとおりです。
- 95% 信頼区間を取得して図にプロットする簡単な方法はありますか?
- 平滑化された曲線をプロットに重ねるにはどうすればよいですか?
- 私のコードを書くべきだったより良い方法はありますか? あまりエレガントではなく、かなり遅いです。
95% 信頼区間を見つけるということは、サンプリングによって得られる経験的最尤推定値 (この例では理論的には 135 になるはずです) が 95% の確率でその範囲内に収まるように、x 軸の範囲を見つけることを意味します。@mbatchkarov が与えた答えは、現在これを正しく行っていません。
https://math.stackexchange.com/questions/656101/how-to-find-a-confidence-interval-for-a-maximum-likelihood-estimateに数学的な答えがあります。
python - Python Statsmodels は、M-Estimators に基づく堅牢な線形モデルから係数をテストします
私は、外生空間ではなく、内生変数にかなりの数の外れ値を持つデータに適合させようとしている線形モデルを持っています。この状況では、M 推定量に基づく RLM が有効であることを調査しました。
次の方法で RLM をデータに適合させると、次のようになります。
要約結果は az 統計量を示しており、有意係数検定は統計量ではなく、これに基づいているようです。ただし、次の R マニュアル ( http://www.dst.unive.it/rsr/BelVenTutorial.pdf ) では、pg での t 統計の使用が示されています。19-21
2 つの質問:
statsmodels が t 検定ではなく z 検定を使用する理由を概念的に説明してもらえますか?
結果では、すべての項と交互作用が非常に有意です (|z| > 4)。ほとんどの場合、各項目には 40 以上の観測値があります。観測数が 21 ~ 25 の項目がいくつかあります。小さなサンプル環境では RLM が効果的ではないと信じる理由はありますか? それが生成する線は、外れ値を再重み付けした後に最適な線である必要がありますが、このサイズのサンプルに対して有効な z 検定ですか (つまり、smf.rlm() によって生成された信頼区間が 95% を生成しないと信じる理由がありますか)。確率範囲? t 検定では、これが問題になる可能性があることはわかっています...)?
ありがとう!
python - 重み付きのpythonモジュール「statsmodels」からの堅牢な線形メソッドを使用していますか?
x で測定されたエラー y_err のあるデータ y があります。matlab のコード、特に堅牢な「オン」の fit メソッドを模倣し、重みを 1/yerr として与えて、これに直線を合わせる必要があります。matlab のドキュメントには、バイスクエア法 (TukeyBiweight 法とも呼ばれます) を使用すると書かれています。これまでの私のコードは..
ただし、yerr から派生した重みを含める方法を見つける必要があります。人々が助けてくれることを願っています.statsmodelモジュールを使用しようとしたのはこれが初めてです.
最初の答えに応えて:私は試しました。
残念ながら、これは matlab 関数と一致しません。
python - Statsmodels 0.5.0、IPython での TAB 補完に問題がある
単純ですが、非常にイライラする問題 - TAB 補完が statsmodels パッケージでは機能しません。さまざまなインストール方法を試しましたが (.exe または pip を使用。easy_install は機能しません)、うまくいきません。助言がありますか?
python - Statsmodels はチャートを複製しますか?
IPython ノートブックをhttp://nbviewer.ipython.org/gist/dartdog/9008026 のセル 5 に投稿しました。このコードを編集すると、重複したグラフが生成されます。
これはグラフコードです:
そして、次から次へとそのグラフィックの 2 つのコピーを取得しますか? 何か案は?SM dev 6.0 の使用参照されているノートブックには、重複したグラフが表示されます。
python - 2 つのベータ版ディストリビューションの製品
2 つの確率変数があるとします。
X ~ ベータ(α1,β1)
Y ~ ベータ(α2,β2)
Z = XY (確率変数の積) の分布を計算したい
を使用scipy
すると、次の方法で単一のベータ版の pdf を取得できます。
しかし、2 つのベータ版の製品についてはどうでしょうか。これを分析的に行うことはできますか?(Python/Julia/R ソリューションは問題ありません)。