21

散布図の 95% 信頼楕円を生成する R 関数があります。出力は次のようになります。各楕円 (50 行) のデフォルトは 50 ポイントです。

           [,1]         [,2]
 [1,]  0.097733810  0.044957994
 [2,]  0.084433494  0.050337990
 [3,]  0.069746783  0.054891438

ggplot2このコマンドから生成された散布図で、「サイト」と呼ばれる因子の各レベルに対して、そのような楕円を多数重ね合わせたいと思います。

> plat1 <- ggplot(mapping=aes(shape=site, size=geom), shape=factor(site)); plat1 + geom_point(aes(x=PC1.1,y=PC2.1))

dflatこれは、次のように呼び出されるデータセットで実行されます。

site      geom         PC1.1        PC2.1       PC3.1        PC1.2       PC2.2
1 Buhlen 1259.5649 -0.0387975838 -0.022889782  0.01355317  0.008705276  0.02441577
2 Buhlen  653.6607 -0.0009398704 -0.013076251  0.02898955 -0.001345149  0.03133990

結果は問題ありませんが、楕円を追加しようとすると (「Buhlen」と呼ばれるこの 1 つのサイトについて考えてみましょう):

> plat1 + geom_point(aes(x=PC1.1,y=PC2.1)) + geom_path(data=subset(dflat, site="Buhlen"),mapping=aes(x=ELLI(PC1.1,PC2.1)[,1],y=ELLI(PC1.1,PC2.1)[,2]))

エラー メッセージが表示されます。"Error in data.frame(x = c(0.0977338099339815, 0.0844334944904515, 0.0697467834016782, : arguments imply differing number of rows: 50, 211

過去にこれを修正することができましたが、方法を思い出せません。geom_path は、新しいポイントをプロットするのではなく、同じポイントに依存しているようです。どんな助けでも大歓迎です。

4

2 に答える 2

23

多分これはあなたを助けるかもしれません:

#bootstrap
set.seed(101)
n <- 1000
x <- rnorm(n, mean=2)
y <- 1.5 + 0.4*x + rnorm(n)
df <- data.frame(x=x, y=y, group="A")
x <- rnorm(n, mean=2)
y <- 1.5*x + 0.4 + rnorm(n)
df <- rbind(df, data.frame(x=x, y=y, group="B"))

#calculating ellipses
library(ellipse)
df_ell <- data.frame()
for(g in levels(df$group)){
df_ell <- rbind(df_ell, cbind(as.data.frame(with(df[df$group==g,], ellipse(cor(x, y), 
                                         scale=c(sd(x),sd(y)), 
                                         centre=c(mean(x),mean(y))))),group=g))
}
#drawing
library(ggplot2)
p <- ggplot(data=df, aes(x=x, y=y,colour=group)) + geom_point(size=1.5, alpha=.6) +
  geom_path(data=df_ell, aes(x=x, y=y,colour=group), size=1, linetype=2)

出力は次のようになります。

ここに画像の説明を入力

より複雑な例を次に示します

于 2011-03-10T15:50:08.343 に答える
22

Keelan Evanini、Ingrid Rosenfelder、Josef Fruehwald(JoFrhwld@gmail.com)は、95%信頼区間の楕円のggplot2統計実装を作成しました(そしてggplot2で楕円をプロットする簡単な方法):

GitHubstat-ellipse.R

彼らのサイト

次のように使用できます。

library(ggplot2)
library(devtools)
library(digest)
source_url("https://raw.github.com/low-decarie/FAAV/master/r/stat-ellipse.R")    
qplot(data=df, x=x, y=y, colour=colour)+stat_ellipse()

ここに画像の説明を入力してください

データを作成するには

set.seed(101)
n <- 1000
x <- rnorm(n, mean=2)
y <- 1.5 + 0.4*x + rnorm(n)
colour <- sample(c("first", "second"), size=n, replace=T)
df <- data.frame(x=x, y=y, colour=colour)
于 2012-04-17T11:45:22.027 に答える