問題タブ [goodness-of-fit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Pythonで科学ライブラリを使用してカイ二乗適合度検定を実行する方法は?
経験的に取得したデータがあると仮定しましょう。
これは指数関数的に分布しており (多少のノイズあり)、カイ 2 乗適合度 (GoF) 検定を使用してこれを検証したいと考えています。Python の標準的な科学ライブラリ (scipy や statsmodels など) を使用して、手動の手順と仮定を最小限に抑えてこれを行う最も簡単な方法は何ですか?
モデルを次のように適合させることができます。
Kolmogorov-Smirnov 検定を計算するのは非常にエレガントです。
しかし、カイ二乗検定を計算する良い方法が見つかりません。
statsmodel にはカイ 2 乗 GoF 関数がありますが、離散分布を前提としています (指数分布は連続です)。
公式のscipy.stats チュートリアルは、カスタム分布のケースのみをカバーしており、確率は多くの式 (npoints、npointsh、nbound、normbound) をいじることによって構築されるため、他の分布でそれを行う方法は私にはよくわかりません。カイ二乗の例では、期待値と DoF が既に取得されていることを前提としています。
また、既にここで説明したように、テストを「手動で」実行する方法を探しているわけではありませんが、利用可能なライブラリ関数の 1 つを適用する方法を知りたいと考えています。
matlab - カイ二乗検定
カイ二乗検定のコードを MATLAB で作成しました。0.897 や 0.287 などの P 値を取得したいのですが、結果が小さすぎます。以下は私のコードです:
同様の結果でADテストを使用してみました:
以下は、ワイブル密度関数を当てはめたデータのヒストグラムです (ワイブル パラメーターはA=4.0420
とですB=2.0853
) 。
r - R - 多くの分布をフィットさせて、gof テストでサンプリング、視覚化、および並べ替えを行います
いくつかのサンプル データに同時に多くの pdfを当てはめ、すべての当てはめとサンプル ヒストグラムをプロットし、Kolmogorov-Smirnov、Anderson-Darling、X2 などのいくつかの gof 基準でフィッティングを並べ替えることができる R のパッケージはありますか? ..? 商用ソフトウェアの EasyFit に似た機能はありますか?
アップデート
最初の質問に対して貴重なコメントをいただきました。具体的には、AIC は、さまざまな数のパラメーターを持つ pdf を比較できるメトリックとして際立っています。ただし、AIC にも制限があります。したがって、モデル選択のためのすべての gof テストの長所と短所を示すある種の要約を考え出す/見つけることは興味深いでしょう。これらのトピックの多くは統計学者には共通ですが、そうではない可能性があり、実際の問題に対して日常的に多くの gof 決定を実行する必要がある実務家にとって非常に役立ちます。
どんな提案でも大歓迎です。
ありがとう!
matlab - p = 適合度の NaN matlab
こんにちは、一連の観察結果があり
ますobs
= https://drive.google.com/file/d/0B3vXKJ_zYaCJVlhqd3FJT0xtWFk/view?usp=sharing
それらがガンマ分布に由来することを証明したいと思います。
そのために私は:
私の問題は、pvalue の NaN を取得することp_gamma_chi
です....どこで間違いを犯すのでしょうか? ありがとう
ここで、分布を視覚的に確認するためのいくつかのコード
matlab - Matlab で lsqcurvefit を使用して 95% 信頼区間を計算するにはどうすればよいですか?
固定パラメーターを使用した Matlab のいくつかの問題により、std から切り替える必要がありました。fit
へのコマンドlsqcurvefit
。
通常の fit
コマンドの場合、出力パラメーターの 1 つが でgof
、そこから各パラメーターの +/- と r^2 値を計算できます。
lsqcurvefit
それは同様に可能であるべきです。しかし、出力パラメーターの1つとして取得しません。
または、私の質問を言い換えると、どのように から fitparamter の +/- を計算するのlsqcurvefit
ですか? 誰かがそれを手伝ってくれますか?
ありがとう、ニコ
sas - 連続 (正のサポート) 分布をフィッティングするための Proc 単変量と Proc 重大度の違い
私の目標は、肯定的なサポートがある任意の分布にデータを適合させることです。(ワイブル(2p)、ガンマ(2p)、パレート(2p)、対数正規(2p)、指数(1P)))。最初の試み、私は proc univariate を使用しました。これは私のコードです
最初に気付いたのは、ワイブル分布の kolmogorov 統計が表示されていないことです。代わりに proc 重大度を使用しました。
これで、ワイブル分布の KS 統計が得られました。次に、proc 重大度と proc 単変量によって生成された KS 統計を比較しました。彼らは違います。なんで?どちらを使用すればよいですか?