次の構造のデータセットがあります。
> data("household", package="HSAUR2")
> household[c(1,5,10,30,40),]
housing food goods service gender total
1 820 114 183 154 female 1271
5 721 83 176 104 female 1084
10 845 64 1935 414 female 3258
30 1641 440 6471 2063 male 10615
40 1524 964 1739 1410 male 5637
「合計」列は、最初の 4 列の合計です。これは、家計の支出を 4 つのカテゴリに分類したものです。
ここで、性別と総支出の条件付き密度プロットが必要な場合は、次のようにします。
cdplot(gender ~ total, data=household)
そして、私はこの画像を取得します:

X 軸に「総」支出を、Y 軸に 4 つのクラス (住宅、食品、商品、サービス) の条件付き分布を示した同じ図が欲しいです。因子を生成する非常に汚いハックしか思いつきません。最初のデータ行では、「住宅」を 820 回繰り返し、次に「食品」を 114 回繰り返します。
もっと簡単な方法があるはずですよね?