0

私はこの事件をどのように解釈するかについてあなたの意見を聞くために書いています。比較しようとしている2つのベクトル「a」と「b」があります。

ウィルコクソン検定では、代替の「より大きい」を使用したb以上の5.139217e-303のp値が得られます。今、私がそれらのそれぞれについて要約すると、私は次のようになります

> summary(a)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0000000 0.0001411 0.0002381 0.0002671 0.0003623 0.0012910 
> summary(c)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0000000 0.0000000 0.0000000 0.0004947 0.0002972 1.0000000

その場合、平均比率は約0.5399031であり、ウィルコクソン検定とは正反対の方向になります(比率>> 1を見つけることを期待していました)

外れ値パッケージを使用して外れ値を削除した後でも、私はまだ同じことをしています。誰かが私がこの結果を得る理由とそれを説明する方法を説明するのを手伝ってもらえますか?

前もって感謝します

4

1 に答える 1

3

あなたはあなたのデータを投稿していないので、これは確かに難しい質問であり、あなたのデータを投稿します(例えば、経由dput()は物事をはるかに簡単にします。それ以外は私たちが指定することしかできません。再現可能な例で素晴らしい質問を提起することについての詳細はここを参照してください。

ただし、データにはsummary、回答を可能にするいくつかのプロパティがあります。

ウィルコクソン検定はデータに不適切のようです。Wilcoxonは各観測値のランクを使用することを忘れないでください。データには同点があるため、ランクを取得するのは困難です。あなたはたくさんの絆を持っているようです(minそしてmedianforcは両方0です)。同点に対処する方法はありますが、他の方法の方が優れています。

t検定を使用したくないように思われるので(たとえば、分布が実際に異なっているように見えることを考えると合理的ですmedian(a) < mean (a)) 、median(c) > mean(c)別のアプローチは順列検定を使用することです。

私のパッケージafex(CRANで、に基づく)には、 (たとえば)t検定、Wilcoxon、および特に順列検定を使用して2つのベクトルを比較するcoin関数が含まれています。compare.2.vectorsnが小さい場合は、順列検定に正確な検定分布を使用することもできます。2つのベクトルaとcが与えられると、結果は次のようになります(データをシミュレートしようとします)。

> require(afex)
> a <- round(runif(100, 0, 0.00129), 5)
> c <- c(rep(0, 60), runif(37, 0, 0.00297), rep(1, 3))
> summary(a)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0000100 0.0002775 0.0006500 0.0006360 0.0009475 0.0012800 
> summary(c)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
0.00000 0.00000 0.00000 0.03054 0.00116 1.00000 

> compare.2.vectors(a,c)
$parametric
   test test.statistic test.value   test.df          p
1     t              t  -1.745388 198.00000 0.08246866
2 Welch              t  -1.745388  99.00094 0.08402002

$nonparametric
             test test.statistic  test.value test.df            p
1 stats::Wilcoxon              W 6772.000000      NA 1.143036e-05
2     permutation              Z   -1.736482      NA 1.929300e-01
3  coin::Wilcoxon              Z    4.389418      NA 0.000000e+00
4          median              Z   -4.514156      NA 0.000000e+00

同じパターンが表示され、Wilcoxonの検定統計量は正ですが、他のすべての検定では負です。したがって、ウィルコクソンを使用しない方がよいですが、他のテストの1つを使用すると、すべて同意します。

PS:関数についてのコメントをうれしく思います。意味のあるテストは他にありますか?

于 2012-09-19T22:02:07.670 に答える