87

データ.csvを12列のファイルとして保存しました。2列目から11列目(ラベル付きF1, F2, ..., F11)はfeaturesです。これらの機能のいずれかまたはをColumn one含みます。labelgoodbad

これらすべての11の機能boxplotのいずれかを、に対してプロットしたいと思いますが、またはで区切ります。これまでの私のコードは次のとおりです。labelgoodbad

qplot(Label, F1, data=testData, geom = "boxplot", fill=Label, 
          binwidth=0.5, main="Test") + xlab("Label") + ylab("Features")

ただし、これはF1に対してのみ表示されますlabel

私の質問は:いくつかのグラフで1つのグラフF2, F3, ..., F11に対してどのように表示するのですか?[0 1]の範囲内で同じスケールになるように、フィーチャを正規化しました。labeldodge position

テストデータはここにあります。問題を説明するために手で何かを描きました(以下を参照)。

手描きの箱ひげ図の例

4

6 に答える 6

130

プロットする前に、データを溶かして(溶けたデータがどのように見えるかについては、以下を参照)、特定の形式でデータを取得する必要があります。そうでなければ、あなたがしたことは大丈夫のようです。

require(reshape2)
df <- read.csv("TestData.csv", header=T)
# melting by "Label". `melt is from the reshape2 package. 
# do ?melt to see what other things it can do (you will surely need it)
df.m <- melt(df, id.var = "Label")
> df.m # pasting some rows of the melted data.frame

#     Label variable      value
# 1    Good       F1 0.64778924
# 2    Good       F1 0.54608791
# 3    Good       F1 0.46134200
# 4    Good       F1 0.79421221
# 5    Good       F1 0.56919951
# 6    Good       F1 0.73568570
# 7    Good       F1 0.65094207
# 8    Good       F1 0.45749702
# 9    Good       F1 0.80861929
# 10   Good       F1 0.67310067
# 11   Good       F1 0.68781739
# 12   Good       F1 0.47009455
# 13   Good       F1 0.95859182
# 14   Good       F1 1.00000000
# 15   Good       F1 0.46908343
# 16    Bad       F1 0.57875528
# 17    Bad       F1 0.28938046
# 18    Bad       F1 0.68511766

require(ggplot2)
ggplot(data = df.m, aes(x=variable, y=value)) + geom_boxplot(aes(fill=Label))

boxplot_ggplot2

編集:私はあなたがファセットする必要があるかもしれないことを理解しています。これもその実装です:

p <- ggplot(data = df.m, aes(x=variable, y=value)) + 
             geom_boxplot(aes(fill=Label))
p + facet_wrap( ~ variable, scales="free")

ggplot2_faceted

編集2:追加、、、x-labels変更、y-labels追加する方法?titlelegend headingjitter

p <- ggplot(data = df.m, aes(x=variable, y=value)) 
p <- p + geom_boxplot(aes(fill=Label))
p <- p + geom_jitter()
p <- p + facet_wrap( ~ variable, scales="free")
p <- p + xlab("x-axis") + ylab("y-axis") + ggtitle("Title")
p <- p + guides(fill=guide_legend(title="Legend_Title"))
p 

ggplot2_geom_plot

編集3:geom_point()箱ひげ図の中心にポイントを揃える方法は?を使用して実行できますposition_dodge。これは機能するはずです。

require(ggplot2)
p <- ggplot(data = df.m, aes(x=variable, y=value)) 
p <- p + geom_boxplot(aes(fill = Label))
# if you want color for points replace group with colour=Label
p <- p + geom_point(aes(y=value, group=Label), position = position_dodge(width=0.75))
p <- p + facet_wrap( ~ variable, scales="free")
p <- p + xlab("x-axis") + ylab("y-axis") + ggtitle("Title")
p <- p + guides(fill=guide_legend(title="Legend_Title"))
p 

ggplot2_position_dodge_geom_point

于 2013-01-30T14:00:48.517 に答える
26

ベースグラフィックを使用して、ボックスの幅とat =組み合わせて、ボックスの位置を制御するために使用できます。boxwex =最初のboxplotステートメントは、空白のプロットを作成します。次に、次の2つのステートメントに2つのトレースを追加します。

df[,-1]以下では、プロットする値から1番目(id)列を除外するために使用していることに注意してください。データフレームが異なる場合は、プロットするデータが含まれている列のサブセットにこれを変更する必要がある場合があります。

boxplot(df[,-1], boxfill = NA, border = NA) #invisible boxes - only axes and plot area
boxplot(df[df$id=="Good", -1], xaxt = "n", add = TRUE, boxfill="red", 
  boxwex=0.25, at = 1:ncol(df[,-1]) - 0.15) #shift these left by -0.15
boxplot(df[df$id=="Bad", -1], xaxt = "n", add = TRUE, boxfill="blue", 
  boxwex=0.25, at = 1:ncol(df[,-1]) + 0.15) #shift to the right by +0.15

ここに画像の説明を入力してください

いくつかのダミーデータ:

df <- data.frame(
  id = c(rep("Good",200), rep("Bad", 200)),
  F1 = c(rnorm(200,10,2), rnorm(200,8,1)),
  F2 = c(rnorm(200,7,1),  rnorm(200,6,1)),
  F3 = c(rnorm(200,6,2),  rnorm(200,9,3)),
  F4 = c(rnorm(200,12,3), rnorm(200,8,2)))
于 2016-08-26T17:32:00.600 に答える
20

プロットパッケージについて言及していないので、ここではLatticeバージョンを使用して提案します(少なくとも、私がここSOにいるので、ラティスのものよりもggplot2の回答が多いと思います)。

 ## reshaping the data( similar to the other answer)
 library(reshape2)
 dat.m <- melt(TestData,id.vars='Label')
 library(lattice)
 bwplot(value~Label |variable,    ## see the powerful conditional formula 
        data=dat.m,
        between=list(y=1),
        main="Bad or Good")

ここに画像の説明を入力してください

于 2013-01-30T14:37:18.707 に答える
13

格子プロットのggplotバージョン:

library(reshape2)
library(ggplot2)
df <- read.csv("TestData.csv", header=T)
df.m <- melt(df, id.var = "Label")

ggplot(data = df.m, aes(x=Label, y=value)) + 
         geom_boxplot() + facet_wrap(~variable,ncol = 4)

プロット: ここに画像の説明を入力してください

于 2013-01-30T16:00:35.020 に答える
9

これは少し古い質問ですが、私も持っていた質問です。受け入れられた回答は機能しますが、ggplotやlatticeなどの追加パッケージを使用せずに同様のことを行う方法があります。箱ひげ図を並べて表示するのではなく、重ねて表示するという点では、それほど良いことではありませんが、次のようになります。

boxplot(data1[,1:4])
boxplot(data2[,1:4],add=TRUE,border="red")

これが何をするかの写真。

これにより、2セットの箱ひげ図が配置され、2番目の箱ひげ図には輪郭(塗りつぶしなし)が赤で表示され、外れ値も赤で表示されます。良い点は、2つの異なるデータフレームに対して、それらの形状を変更しようとするのではなく、機能することです。迅速で汚い方法。

于 2016-08-26T15:08:55.150 に答える
6

ベースRでは、相互作用()を使用した式インターフェースを:使用してこれを実現できます。

df <- read.csv("~/Desktop/TestData.csv")
df <- data.frame(stack(df[,-1]), Label=df$Label) # reshape to long format

boxplot(values ~ Label:ind, data=df, col=c("red", "limegreen"), las=2)

例

于 2018-10-08T12:42:35.443 に答える