問題タブ [goodness-of-fit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 正規分布の適合度
カイ二乗ベースの基準を使用して、誤差の正規分布の適合度を推定しようとしています。
具体的には、サンプルがあり、見積もりです。そこから、おおよその誤差を計算します。ここで、これらの誤差を新しい、正規分布と仮定された) 観測値 O として使用します。ここで、予想される理論上の観測値 E は、これらの誤差の平均値または 0 (推定値を完全にする必要があります) のいずれかです。
https://en.wikipedia.org/wiki/Goodness_of_fitカイ 2 乗統計を使用すると、完全に適合するために 1 に等しくなるはずですが、アプリオリには期待できません。
おおよその適合が必要で、得られるのはカイ二乗統計値で、~1.3 - 1.5 です。小さなサンプルでは、これらは時々 2-3 になります。
これは耐えられる適合と見なされますか?
これをPythonで実装したので、コードは
また
ここで、N は観測数 (len(error)) であり、n = 2 (適合しようとしている平均値と変数値のパラメーターの数) です。
ガウス分布を近似するのに十分な統計 (少なくとも 10 サンプルなど) が必要なため、6 ~ 8 個の観測値でかなりうまく機能します (少なくとも 10 サンプルなど)。 .
データのサンプル:
ここから、平均と var を計算し、上記の手順を適用します (私の真のデータは、各列が上記のようにシリーズを含む pd.DF であるため、.sum(0) です。他のデータ型を使用する場合は、sum() で使用できます)。 )
@tom からのコメントに従います。使用しているデータはカテゴリではなく数値であるため、scipy.stats.chisquare を使用することは不可能です。Python から直接行う方法がない限り、カイ統計量と p 値を自分で計算する必要があるようです。
前もって感謝します。
python - 適合度の不一致プロットをプロットしながらシミュレートされた値を計算する方法は?
pymc を使用して MCMC で最適な適合値を取得した後、適合度をテストするための不一致プロットを作成しようとしています。私のコードは次のようになります:
ここで、 https://pymc-devs.github.io/pymc/modelchecking.htmlのセクション 7.3 で説明されている方法を使用して適合度をテストしたいと思います。このためには、最初に f_sim を見つける必要があるため、上記の行の後に次のコードを書きました。
これにより、 AttributeError: 'Normal' object has no attribute 'trace'というエラーが発生します。不一致プロットを行う前に、gof_plot を使用しようとしています。関数のガウス特性のため、通常の代わりに他の分布を使用することは良い考えではないと思います。誰かが私が間違っていることを教えてくれれば、本当に感謝しています。また、pymc の正規分布には、期待値を取得するための Normal_expval がありません。f_exp を計算できる他の方法はありますか? ありがとう。
python - `scikit-learn` の `r2_score` と R^2 計算の重大な不一致
質問
r2_score
scikit-learn の関数と、ウィキペディアで説明されている決定係数の式に大きな違いがあるのはなぜですか? どれが正しいですか?
環境
私は線形モデルと二次モデルを予測するために Python 3.5 を使用しています。r2_score
ただし、テスト中、メトリックscikit-learn
とウィキペディアで提供される計算の間には顕著な違いがあります。
コード
上記のリンク先のウィキペディア ページの例を計算するコードを参照としてここに提供します。
明らかなように、Wikipedia の参照値が であるのに対し、scipy
計算値はです。-3.8699999999999992
0.998
ありがとうございました!
更新:これは、scikit-learn で R^2 がどのように計算されるかについてのこの質問とは異なります。私が理解しようとしているのは、両方の結果の不一致であるためです。その質問は、scikit で使用されている数式はウィキペディアのものと同じであり、異なる値になるべきではないと述べています。
更新 #2:ウィキペディアの記事の例を読み間違えたことが判明しました。以下の回答とコメントは、私が提供する例は、例の (x, y) 値の線形の最小二乗法であることを示しています。それについては、ウィキペディアの記事の答えが正しいです。そのために提供される R^2 値は 0.998 です。両方のベクトル間の R^2 については、scikit の答えも正しいです。助けてくれてどうもありがとう!
r - Hosmer-Lemeshow 適合度 (GOF) 検定
HL GoF 検定を生存分析に適用したいと考えています。
テストの説明は次の場所にあります。
すぐに入手できるデータを使用して、95% CI で cdf をプロットできます。
しかし、HL GoF 検定を実行して、ワイブル分布が正しくないかどうかを評価したいと考えています。
したがって:
試してみましたが、正しくありません。誰かが正しい適合確率に向けて私を導くことができますか、それらは観測と同じ長さである必要があります
matlab - 非標準のユーザー指定 PDF での MATLAB の chi2gof の使用
chi2gof
MATLAB を使用してカイ 2 乗適合度検定を実行したいと考えています。私の問題は、私が想定した (つまり、理論上の) 分布が、MATLAB に組み込まれている標準の確率分布の 1 つでないことです。私の希望するディストリビューションの具体的な形式は次のとおりです。
とa
はb
定数です。chi2gof
任意の PDFに使用する方法が必要ですか? Google で徹底的に検索しましたが、手ぶらで出てきました。