2

私はこのようなデータセットを持っています...

mine tonnes week
AA   112    41
AA   114    41
AA   119    41
BB   108    41 
BB   112    41
AA   110    42
AA   109    42
AA   102    43
AA   101    43

そして、ggplot2 で箱ひげ図を作成して、毎週のトン数の分布を表示したいと考えています。しかし、私は自分の AA からの結果のみが必要です。

こんな感じで動くと思っていたのに……。

qplot(factor(week), tonnes[mine == "AA"], data = sql_results, geom = "boxplot")

しかし、代わりに、このエラーが発生します。

Error in data.frame(x = c(13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L,  :

  arguments imply differing number of rows: 423100, 109436

それはおそらく非常に単純ですが、これを行う正しい方法を考え出すのはあまり運がありません。

4

1 に答える 1

4

近い。あなたの例では、トンのサブセットを作成しましたが、週のサブセットは作成しませんでした。

sql_results<-structure(list(mine = structure(c(1L, 1L, 1L, 2L, 2L, 1L, 1L, 
1L, 1L), .Label = c("AA", "BB"), class = "factor"), tonnes = c(112, 
114, 119, 108, 112, 110, 109, 102, 101), week = c(41, 41, 41, 
41, 41, 42, 42, 43, 43)), row.names = c("1", "2", "3", "4", "5", 
"6", "7", "8", "9"), .Names = c("mine", "tonnes", "week"), class = "data.frame")

qplot(factor(week), tonnes, data = subset(sql_results,mine=="AA"), geom = "boxplot")
于 2010-01-16T07:02:45.060 に答える