16

調査を容易にするためのアプリを作成していますが、その一部として統計計算を行う必要があります。現在、研究者はSPSSと呼ばれるプログラムを使用しています。彼らが気にする出力の一部は次のようになります。

【SPSSアウトプットの一部】

彼らは本当に と の値だけに関心がFありSig.ます。私の問題は、統計のバックグラウンドがなく、テストの名前や計算方法がわからないことです。

値はF 検定Fの結果かもしれないと思っていましたが、ウィキペディアに記載されている手順に従った後、得られたものとは異なる結果が得られました。SPSS

4

6 に答える 6

3

あなたの質問から、あなたの研究仲間は特定の統計分析が実行されるプロセスを自動化したいと思っていると思います(つまり、彼らはデータセットをバッチ処理したいと思っています)。2つのオプションがあります。

1)SPSSはPythonを介してスクリプト化できるようになりました(バージョン15以降)-spss.comにアクセスして、pythonを検索します。Pythonスクリプトを記述して、データ分析を自動化し、ピボットテーブルからキー値を抽出して、好きな方法で回答を処理できます。これには、Pythonスクリプトの結果と、共同作業者のSPSSでの手作業で計算された作業とを正確に比較できるという利点があります。したがって、この作業を行うために統計を実際に知る必要はありません(これは重要な利点です)

2)これは、おそらくスクリプト化できる無料の統計環境であるRで行うことができます。これには、正しく実行していることを確認するために統計を学習する必要があるという欠点があります。

于 2008-09-22T03:29:26.620 に答える
3

このウェブサイトは、もう少し役立つかもしれません。これも。

私は統計コースのかなりさびた記憶から取り組んでいますが、ここでは何も起こりません:

分散分析 (ANOVA) を行っている場合、実際には、「グループ間」の平均二乗分散と「グループ内」の平均二乗分散からの比率として F 統計量を計算します。上記の 2 番目のリンクは、この計算に適しているようです。

これにより、「グループ間」の分散は説明力であり、「グループ内」の分散は確率誤差であるため、F 統計量はモデルの強力さを正確に測定します。高い F は、非常に重要なモデルを意味します。

多くの統計操作と同様に、Sig を逆決定します。F 統計を使用します。ここで、ウィキペディアの情報が少し役に立ちます。あなたがしたいことは、SPSS によって与えられた自由度を使用して、F テーブルが計算した F 統計を与える適切な P 値を見つけることです。これが発生する P 値 [F(表) = F(計算)] が有意性です。

概念的には、有意性の値が低いほど、帰無仮説を棄却する能力が非常に強いことを示します (これらの目的では、モデルに説明力があると判断することを意味します)。

これのいずれかが間違っている場合は、数学の人々に申し訳ありません。編集するために戻って確認します!!!

頑張って。統計は楽しいですが、この部分ではないかもしれません。=)

于 2008-08-04T23:32:54.797 に答える
2

統計は難しいです:-)。本や論文を読んだり再読したりして1年が経ちましたが、私はその基本を理解していると自信を持ってしか言えません。

使用しているプログラミング言語の既製のライブラリを調査することをお勧めします。これは、一般に数学、特に統計で多くの落とし穴があるためです(丸め誤差は明らかな例です)。

例として、インタラクティブな環境であり、GPLの下で配布されているC ++コードから使用できるライブラリであるRプロジェクトを見ることができます(つまり、内部でのみ使用し、結果のみを公開している場合は、コードを開く必要はありません)。

于 2008-08-18T06:01:11.973 に答える
2

要するに、これを手動で行うのではなく、既存のソフトウェアをリンク/使用してください。sain_grocen の答えは正しくありません。:(

これらはすべて、多変量応答多重回帰で通常使用されるパラメーター推定値の有意性の検定です。これらは、統計プログラミング環境の外で行うのは簡単なことではありません。既存の統計プログラムから出力を取得するか、そのコードにリンクして使用できるプログラムを使用することをお勧めします。

最初の回答 (sain_grocen の回答) が間違った道に導くのではないかと心配しています。彼の説明は、あなたが実際に扱っているものの特殊なケースである可能性があります。彼のリンクで説明されている anova は、バランスの取れた設計における単一変量応答用です。これらは、あなたが見ている F 統計ではありません。出力の名前 (Pillai の Trace、Hotelling の Trace など) は、利用可能な多変量バージョンの一部です。それらは、特定の仮定の下で F 分布を持ちます。ここで教科書に相当する資料を説明することはできません。Johnson と Wichern による「Applied Multivariate Statistical Analysis」を参照することから始めることをお勧めします。

于 2008-09-16T23:17:17.387 に答える
0

SPSS自体が問題の優れた解決策ではない理由を詳しく説明できますか?操作が難しい出力としてピボットテーブルを生成するということですか?プログラムの費用ですか?

F統計は、任意の数の特定のテストから発生する可能性があります。Fは、正規(ガウス)または均一のような単なる分布(大まかに:値のグループの「頻度」の記述)です。一般に、それらは分散の比率から生じます。意見:多くの統計家(私自身を含む)は、Fベースのテストが不安定であると考えています(専門用語:非堅牢)。

特定の出力統計(Pillaiのトレースなど)は、元の分析がMANOVAの例であることを示唆しています。これは、他のポスターが説明しているように、複雑で、正しい手順を取得するのが困難です。

また、MANOVAとSPSSの使用に基づいて、これは心理学または社会学のプロジェクトであると思います...そうでない場合は、啓蒙してください。他のより単純なモデルは、実際には理解しやすく、再現性が高い可能性があります。地元の大学の統計コンサルティンググループがある場合は、それを参照してください。

幸運を!

于 2008-09-17T13:48:44.013 に答える
0

これは、統計とSPSSに関する非常に優れたサイトからのMANOVA出力の説明です。

説明付きの出力: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

MANOVA または多変量 GLM を実行する方法と理由: (上記と同じパスですが、'/manova.htm' で終了します)

これらの出力を計算するソフトウェアをゼロから作成するのは、時間がかかり、困難です。やるべき数値問題と逆行列がたくさんあります。

Henry が言ったように、Python スクリプトまたは R を使用してください。さらに、SPSS 自体は、OMS と呼ばれるものを使用して、出力テーブルをファイルにエクスポートできます。SPSS 内のスクリプトでこれを実行できます。

研究グループの誰が SPSS を知っているかを見つけて、彼らと協力してください。

于 2009-12-22T01:56:52.593 に答える