Python でカイ二乗検定を実行したいと思います。これを行うコードを作成しましたが、scipy のドキュメントが非常にまばらであるため、自分が行っていることが正しいかどうかはわかりません。
まず背景: 私には 2 つのユーザー グループがあります。私の帰無仮説は、どちらのグループの人もデスクトップ、モバイル、またはタブレットを使用する可能性が高いかどうかに有意差はないというものです。
これらは、2 つのグループで観測された頻度です。
[[u'desktop', 14452], [u'mobile', 4073], [u'tablet', 4287]]
[[u'desktop', 30864], [u'mobile', 11439], [u'tablet', 9887]]
これが私のコードですscipy.stats.chi2_contingency
:
obs = np.array([[14452, 4073, 4287], [30864, 11439, 9887]])
chi2, p, dof, expected = stats.chi2_contingency(obs)
print p
これにより、 の p 値が得られます2.02258737401e-38
。これは明らかに有意です。
私の質問は: このコードは有効に見えますか? 特に、私が持っているデータを考えると、scipy.stats.chi2_contingency
またはを使用する必要があるかどうかはわかりません。scipy.stats.chisquare