1

私は格子histogramパッケージから使用して、男性または女性の 2 つのオプションを使用して変数を調整する 2 つのヒストグラムをプロットしています。

histogram(~ raw$Housework_Tot_Min [(raw$Housework_Tot_Min != 0) & 
(raw$Housework_Tot_Min < 1000)] | raw$Gender)

コードの出力: 2 つのヒストグラム、性別ごとの家事の分数

しかし、実際にデータを見ると、これらのヒストグラムは正しくありません。プロットすることにより:

histogram(~ raw$Housework_Tot_Min [(raw$Housework_Tot_Min != 0) & 
(raw$Housework_Tot_Min < 1000) & (raw$Gender == "Female")]

と:

histogram(~ raw$Housework_Tot_Min [(raw$Housework_Tot_Min != 0) & 
(raw$Housework_Tot_Min < 1000) & (raw$Gender == "Male")]

再び 2 つのヒストグラムが表示されますが、見た目が大きく異なります

これらの出力が一致しない理由について誰かが洞察を持っていますか? プロットするバイナリタイプのパネルがたくさんありますが、それらを個別に実行する必要があると、格子パッケージを操作する目的が実際に無効になります!

これが簡単な概念の根本的な誤解に反する場合はお詫びします。私はまだ R の初心者です! 助けてくれてありがとう。

4

2 に答える 2

0

この問題は、ブラケットを使用して適用された除外に基づくデータの不一致に関連していたことが判明しました。それ以外の:

histogram(~ raw$Housework_Tot_Min [(raw$Housework_Tot_Min != 0) & 
(raw$Housework_Tot_Min < 1000)] | raw$Gender)

それは読むべきです:

histogram(~ Housework_Tot_Min [(Housework_Tot_Min != 0) & (Housework_Tot_Min < 1000)] | 
        Gender [(Housework_Tot_Min != 0) & (Housework_Tot_Min < 1000)], data = raw,
      main = "Time Observed Housework by Gender",
      xlab = "Minutes spent",
      breaks = seq(from = 0, to = 400, by = 20))

家事時間変数と性別変数の両方に除外が適用され、データの不一致が解消されていることに注意してください。

正しいプロットを以下に貼り付けました。ご指導いただきました皆様に改めて感謝申し上げます。

更新されたヒストグラム

于 2016-04-23T23:52:14.153 に答える