4

詳細を説明する前に、ここに私のデータがあります:

set.seed (1234) 
datas <- data.frame (Indv = 1:20, Xvar = rnorm (20, 50, 10),
Yvar = rnorm (20, 30,5), Yvar1 = rnorm (20, 10, 2),
Yvar2 = rnorm (20, 5, 1), Yvar3 = rnorm (20, 100, 20),
Yvar4 = rnorm (20, 15, 3))

本質的にポイントプロットであるグラフ(Metroglymph)を作成したいのですが、残りの変数(Yvar1、Yvar2、Yvar3、Yvar4)にスケーリングされたポイントから方向付けられたスパイク(線)を持つポイント(XvarとYvarの)。各スパイクは順序付けられており、できれば色分けされています。

require(ggplot2)
ggplot(datas, aes(x=Xvar, y=Yvar)) +
    geom_point(shape=1, size = 10) + theme_bw()

ここに画像の説明を入力してください

4

2 に答える 2

8

これがあなたに役立つかもしれない1つの可能なアプローチです。stat_spoke()ggplot2から使用します。各y変数は、への4つの個別の呼び出しでスポーク半径にマップされますstat_spoke

plot_1 = ggplot(datas, aes(x=Xvar, y=Yvar)) +
         stat_spoke(aes(angle=(1/8)*pi, radius=Yvar1), colour="#E41A1C",size=1) +
         stat_spoke(aes(angle=(3/8)*pi, radius=Yvar2), colour="#377EB8",size=1) +
         stat_spoke(aes(angle=(5/8)*pi, radius=Yvar3), colour="#4DAF4A",size=1) +
         stat_spoke(aes(angle=(7/8)*pi, radius=Yvar4), colour="#984EA3",size=1) +
         geom_point(shape=1, size = 10)

ggsave("plot_1.png", plot_1)

ここに画像の説明を入力してください

データと特定のニーズによっては、変数を変換してプロットによりよく適合するようにすることが理にかなっている場合があります。

normalize = function(x) {
    new_x = (x - mean(x)) / sd(x)
    new_x = new_x + abs(min(new_x))
    return(new_x)
}

plot_2 = ggplot(datas, aes(x=Xvar, y=Yvar)) +
         stat_spoke(aes(angle=(1/8)*pi, radius=normalize(Yvar1)), colour="#E41A1C", size=1) +
         stat_spoke(aes(angle=(3/8)*pi, radius=normalize(Yvar2)), colour="#377EB8", size=1) +
         stat_spoke(aes(angle=(5/8)*pi, radius=normalize(Yvar3)), colour="#4DAF4A", size=1) +
         stat_spoke(aes(angle=(7/8)*pi, radius=normalize(Yvar4)), colour="#984EA3", size=1) +
         geom_point(shape=1, size = 10)

ggsave("plot_2.png", plot_2)

ここに画像の説明を入力してください

重要な注意事項:同じスポーク半径値の場合、プロットされた線の大きさは、線がより垂直である場合は大きくなり、線がより水平である場合は小さくなります。これは、xの範囲がデータセットのyの範囲の約2倍であるためです。x対y軸の比率が変化すると、プロットされた角度も歪んでしまいます。追加coord_equal(ratio=1)するとこの問題は解決しますが、他の問題が発生する可能性があります。 ここに画像の説明を入力してください

編集:ループなしでプロット

これを理解するのは楽しくて教育的でした。おそらく、繰り返しコードを入力する方が時間効率が良かったでしょう。誰かがこのコードを改善するためのアドバイスを提供できる場合は、コメントしてください。

library(reshape2)

dat2 = melt(datas, id.vars=c("Indv", "Xvar", "Yvar"), 
            variable.name="spoke_var", value.name="spoke_value")

# Apply normalization in a loop. Can plyr do this more gracefully?.
for (var_name in levels(dat2$spoke_var)) {
    select_rows = dat2$spoke_var == var_name
    norm_dat = normalize(dat2[select_rows, "spoke_value"])
    dat2[select_rows, "spoke_value"] = norm_dat
}

# Pick an angle for each Yvar, then add angle column to dat2.
tmp = data.frame(spoke_var=unique(dat2$spoke_var))
tmp$spoke_angle = seq(from=pi/8, by=pi/4, length.out=nrow(tmp))
dat2 = merge(dat2, tmp)

plot_4 = ggplot(dat2, aes(x=Xvar, y=Yvar)) +
         stat_spoke(data=dat2, size=1,
                    aes(colour=spoke_var, angle=spoke_angle, radius=spoke_value)) +
         geom_point(data=datas, aes(x=Xvar, y=Yvar), shape=1, size=7) +
         coord_equal(ratio=1) +
         scale_colour_brewer(palette="Set1")
于 2012-07-19T23:32:06.977 に答える
2

より手動のアプローチは次のとおりです。

set.seed (1234)
datas <- data.frame (Indv = 1:20, Xvar = rnorm (20, 50, 10),
Yvar = rnorm (20, 30,5), Yvar1 = rnorm (20, 10, 2),
Yvar2 = rnorm (20, 5, 1), Yvar3 = rnorm (20, 100, 20),
Yvar4 = rnorm (20, 15, 3))
datas$SYvar1 <- 2 + scale (datas$Yvar1)
datas$SYvar2 <- 2 +  scale (datas$Yvar2)
datas$SYvar3 <- 2 + scale (datas$Yvar3)
datas$SYvar4 <- 2 +  scale (datas$Yvar4)

    require(ggplot2)
    p <- ggplot(datas, aes(x=Xvar, y=Yvar)) +  
   geom_point(size = 10, pch = 19, col = "yellow2")
    p + geom_segment(aes(x = Xvar, y = Yvar, xend = Xvar + SYvar1, 
   yend = Yvar), col = "red4", size = 1) +
    geom_segment(aes(x = Xvar, y = Yvar, xend = Xvar, 
    yend = Yvar + SYvar2), col = "green4", size = 1) +
    geom_segment(aes(x = Xvar, y = Yvar, xend = Xvar-2.5,
    yend = Yvar + SYvar3), col = "darkblue", size = 1) +
    geom_segment(aes(x = Xvar, y = Yvar, xend = 
     Xvar - SYvar4, yend = Yvar ), col = "red", size = 1) +
    theme_bw()

ここに画像の説明を入力

于 2012-07-20T00:05:22.667 に答える