基本的に他の配列の平均値で構成される A & B という名前の同じ形状 (105,234) の 2 つの 2 次元配列があります。私は Python の scipy パッケージに精通していますが、2 つの配列が個々の配列インデックスで統計的に有意に異なるかどうかをテストする方法を見つけることができないようです。これは単なる大規模な 2D ペア T 検定だと思いますが、問題があります。使用するアイデアやその他のパッケージはありますか?
4 に答える
グリッドポイントでの各平均の基礎となる分散が同じであり、観測数が同じか既知であると仮定すると、平均の配列を使用して平均の標準偏差を直接推定できます。
格子点間の差を標準偏差で割ると、t 個の分布確率変数が得られます。これを直接テストできます。つまり、p 値を計算できます。
多くのポイントのテストとして、複数のテストの問題http://en.wikipedia.org/wiki/Multiple_comparisons#Large-scale_multiple_testingに遭遇し、p 値を修正する必要があります。
あなたの質問が「二次元分布は異なりますか?」である場合は、
数値レシピ p.11 を参照してください。763
(そして numpy / scipy でそれを行う方法についてさらに尋ねます)。stats.stackexchangeで質問することもできます。
x、y 座標は問題ではなく、独立した測定値の 2 つの巨大なセットがあるだけだと思います。
考えられるアプローチの 1 つは、各配列の平均の標準偏差を計算し、この値をスチューデント係数 (天文学的な数のサンプルと 95 % の信頼レベルではおそらく 1.645) に掛けて、平均の周りの信頼範囲を取得することです。仕方。2 つの異なる配列の信頼範囲が重複している場合、それらの間の差は重要ではありません。式はここにあります。