2 つのヒストグラムがあります。
int Hist1[10] = {1,4,3,5,2,5,4,6,3,2};
int Hist1[10] = {1,4,3,15,12,15,4,6,3,2};
Hist1 の分布はマルチモーダル タイプです。
Hist2 の分布は、単一の顕著なピークを持つユニモーダル タイプです。
私の質問は
- プログラムで配布の種類を特定する方法はありますか?
- これらの 2 つのヒストグラムが類似しているかどうかを定量化する方法は?
ありがとう
2 つのヒストグラムがあります。
int Hist1[10] = {1,4,3,5,2,5,4,6,3,2};
int Hist1[10] = {1,4,3,15,12,15,4,6,3,2};
Hist1 の分布はマルチモーダル タイプです。
Hist2 の分布は、単一の顕著なピークを持つユニモーダル タイプです。
私の質問は
ありがとう
#2 については、相互相関を計算できます(バケット自体を並べ替えることができる限り)。これにより、「類似性」の大まかな見積もりが得られます。
ラジ、
私はあなたの他の質問にC関数を投稿しました(自動的に2つのシリーズを比較します - Dissimilarity test)。これは、2つの類似データセット間の相違を計算します。実際には、実際のデータが予測データとどれだけ一致しているかを示すことを目的としていますが、目的に使用できると思います。
基本的に、誤差が小さいほど、2 つのセットは類似しています。
これらは単なる推測ですが、各分布をガウス分布としてフィッティングし、R 2 乗値などを使用して分布が単峰性かどうかを判断します。
2 つの分布の類似性については、自己相関を行い、自己相関の正のピーク値を類似性の尺度として使用してみます。これらのアイデアはかなり大雑把ですが、うまくいけば、いくつかのアイデアを得ることができます.
ヒストグラムの比較(クラウド モデリングで使用)。
(これは MS .doc ファイルです。)
Minitab、STATA、R など、分布を既知の離散分布に「適合」させるさまざまなソフトウェア パッケージがあります。R で分布を適合させる方法については、こちら を参照してください。これをゼロからプログラミングすることはお勧めしません。
分布の比較に関して、どちらの分布も既知の分布 (ポアソン分布、二項分布など) に適合しない場合は、ここで説明するノンパラメトリック手法を使用する必要があります。