-2

私は現在、調査システムを設計しています(調査には多くの質問があり、質問には多くの回答があり、回答はユーザー、調査、質問と回答に属します)。

ユーザーモデルには多くの人口統計データがあり、さまざまな質問などに対する数十万の回答が期待されます。

最終的には、たとえば、応答を分析する必要があります。男性の80%はバナナが好きで、女性の20%はフォードなどを所有しています。

R、SAS、SPSSなどの統計言語を調べていますが、これらのプログラムで使用するために、データを特定の方法で構造化する必要があるかどうか疑問に思っていますか?それとも、それらはすべてcsvファイルを受け入れますか?

統計データとそのデータモデルの構築に関して、何かアドバイスはありますか?

最後に、SAS、SPSS、およびStataのコストはいくらですか?

4

1 に答える 1

2

CSV files十分すぎるほどです。R行と列に配置されたすべてのデータを管理するのに強力です。

例:csvのすべての列をヘッダー付きの変数/応答として配置でき、行はデータまたはその逆になります。

行と列に配置されていれば問題ありません。CommaSpaceCSVファイルの区切り列は簡単に処理できます。私が具体的であるというわけではありません、あなたは何でも持つことができて、強力なマッチングdelimiterを持っています。Rregular expression

唯一の提案は、物事を簡単にするために、データセットごとに異なるCSVファイルを作成する必要があることです。すべてdata-frame、CSVファイルから簡単にインポートできます。

あなたがそれを成し遂げたら、あなたは自由にの力を解き放つことができますR

于 2012-06-05T21:51:19.183 に答える