0

各行がデータのカテゴリに対応する複数行グラフを視覚化する次の R コードがあります。コードでは、カテゴリに変数 nk が与えられています。私のデータセットは次のようになります。

k   precision   recall
0.25    0.02    1.011
0.25    0.04    1.011
0.5 0.15    0.941
0.5 0.17    0.931
0.5 0.18    0.921
0.5 0.19    0.911
1.0 0.36    0.831
1.0 0.39    0.811
1.0 0.41    0.801

問題は、k = 1.0 の線のみを視覚化し、k = 0.5 および 0.25 の線を視覚化しないことです。k = 0.5 または 0.25 の線を視覚化するために、整数ではない nk 変数を使用するにはどうすればよいですか?

dtf$k <- as.numeric(dtf$k)
nk <- max(dtf$k)
xrange <- range(dtf$precision)
yrange <- range(dtf$recall)
plot(xrange, yrange,
 type="n",
 xlab="Precision",
 ylab="Recall"
 )
colors <- rainbow(nk)
linetype <- c(1:nk)
plotchar <- seq(18, 18+nk, 1)
for (i in 1:nk) {
 Ki <- subset(dtf, k==i)
 lines(Ki$precision, Ki$recall,
 type="b",
 lwd=2,
 lty=linetype[i],
 col=colors[i],
 pch=plotchar[i]
 )
}
title("Methods varying K", "Precision Recall")
legend(xrange[1], yrange[2],
 1:nk,
 cex=1.0,
 col=colors,
inset=c(-0.2,0),
 pch=plotchar,
 lty=linetype,
 title="k"
) 
4

1 に答える 1

1

データ

    dtf <- read.table(header = TRUE, text = 'k   precision   recall
0.25    0.02    1.011
0.25    0.04    1.011
0.5 0.15    0.941
0.5 0.17    0.931
0.5 0.18    0.921
0.5 0.19    0.911
1.0 0.36    0.831
1.0 0.39    0.811
1.0 0.41    0.801')
dtf$k <- factor(dtf$k)

ggplot2 ソリューション

require(ggplot2)
ggplot(dtf, aes(x = precision, y = recall, col = k)) +
  geom_line()

基本液

plot(recall ~ precision, data = dtf, type = 'n')
cols = c('red', 'blue', 'green')
levs <- levels(df$k)
for(i in seq_along(levs)){
  take <- df[df$k == levs[i], ]
  lines(take$precision, take$recall, col = cols[i])
}
于 2015-03-15T21:30:22.187 に答える