2

次の構造のデータセットがあります。

> data("household", package="HSAUR2")
> household[c(1,5,10,30,40),]
   housing food goods service gender total
1      820  114   183     154 female  1271
5      721   83   176     104 female  1084
10     845   64  1935     414 female  3258
30    1641  440  6471    2063   male 10615
40    1524  964  1739    1410   male  5637

「合計」列は、最初の 4 列の合計です。これは、家計の支出を 4 つのカテゴリに分類したものです。

ここで、性別と総支出の条件付き密度プロットが必要な場合は、次のようにします。

cdplot(gender ~ total, data=household)

そして、私はこの画像を取得します:

ここに画像の説明を入力

X 軸に「総」支出を、Y 軸に 4 つのクラス (住宅、食品、商品、サービス) の条件付き分布を示した同じ図が欲しいです。因子を生成する非常に汚いハックしか思いつきません。最初のデータ行では、「住宅」を 820 回繰り返し、次に「食品」を 114 回繰り返します。

もっと簡単な方法があるはずですよね?

4

1 に答える 1