2

少し前に、Excelの代わりにRを使い始めました。私が扱っているデータベースは非常に大きく、それらをうまく機能させるために新しいツールが必要でした。このWebサイトで、Rに関する多くの回答を見つけることができました。これは、スクリプトの作成に役立ちましたが、特定の種類の分析について決定的なものを見つけることができませんでした。

私のデータは次のようになります。

Col1   Col2     Col3    ... Col50  

 M    18-24     Single  ... Employed

 F    18-24     Married ... Unemployed

 F    Under 18  Single  ... Employed

通常、私が扱っているデータベースには100,000行と30〜70列があり、通常、列ごとに20個以下の一意の値があります。

私が欲しいのは、各列の一意の値ごとの頻度カウントを提供するサブセット出力です。

Col1

Variable name / F / M

Frequency / 2 / 1

.....

Col50

Variable name / Employed / Un-employed

Frequency /  2 / 1

誰かが少なくとも私がそれらのカテゴリー値を数えるために何を探すべきかについてのヒントを私に与えることができますか?特別なパッケージか何かが必要ですか?値をカウントする関数をいくつか見つけることができましたが、それらは数値のみを参照しています(のように"table()function"

デビッドロジャース

4

2 に答える 2

5

tableあなたが望むもののように聞こえます。各値の出現回数が表示されます。テーブルを各列に簡単に適用するには、lapply を使用するだけです

lapply(your_data, table)
# Example use and output
lapply(mtcars, table)
于 2012-11-09T17:06:39.920 に答える