1

Excelに2列と複数行のデータがあります。各列はアルゴリズムを表し、行の値は異なるパラメーターを使用したこれらのアルゴリズムの結果です。これら2つのアルゴリズムの統計的有意性テストをExcelで行いたいです。誰でも関数を提案できますか?

結果として、「アルゴリズム A はアルゴリズム B よりも 8% パフォーマンスが 0.9 の確率 (または 95% の信頼区間) で優れている」のように述べるとよいでしょう。

ウィキペディアの記事は、私が必要とするものを正確に説明しています: http://en.wikipedia.org/wiki/Statistical_significance

とても簡単な作業のように思えますが、科学的な測定関数を見つけることができませんでした。

Excel の組み込み関数または関数スニペットに関するアドバイスをいただければ幸いです。

ありがとう..

編集:

tharkun のコメントの後、いくつかの点を明確にする必要があることに気付きました。結果は 1 ~ 100 の間の実数にすぎません (パーセント値です)。各行は異なるパラメータを表すため、行の値はこのパラメータに対するアルゴリズムの結果を表します。結果は相互に依存しません。アルゴリズム A とアルゴリズム B のすべての値の平均を取ると、アルゴリズム A が生成したすべての結果の平均は、アルゴリズム B よりも 10% 高いことがわかります。しかし、これが統計的に有意かどうかはわかりません。言い換えれば、アルゴリズム A がアルゴリズム B よりも 100% 高いスコアを獲得した 1 つのパラメーターについて、アルゴリズム B がより高いスコアを獲得した可能性がありますが、この 1 つの結果だけで、平均の差は 10% になります。そして、私はこの計算をExcelだけで行いたいと思っています。

4

1 に答える 1

3

明確にしていただきありがとうございます。その場合、独立標本の T 検定を実行します。つまり、2 つの独立したデータセットの平均を比較したいということです。

Excel には関数 TTEST があり、それが必要です。

あなたの例では、おそらく 2 つのテールとタイプ 2 を使用する必要があります。

この数式は、アルファ エラーの確率として知られる確率値を出力します。これは、2 つのデータセットが異なると想定していたが、そうでなかった場合に発生するエラーです。アルファ エラー確率が低いほど、セットが異なる可能性が高くなります。

値が 0.01 (1%) 未満の場合、または重大な結果が 0.001 以下の場合にのみ、2 つのデータセットの差を受け入れる必要があります。また、t 検定では、データセットごとに少なくとも約 30 の値が必要であり、十分に信頼できること、およびタイプ 2 検定では 2 つのデータセットの分散が等しいことを前提としていることも知っておく必要があります。等分散が与えられていない場合は、タイプ 3 検定を使用する必要があります。

http://depts.alverno.edu/nsmt/stats.htm

于 2009-08-05T12:05:49.327 に答える