19

データフレームの各列を ggplot2 の個別のレイヤーにプロットしたいと思います。レイヤーごとにプロットを作成するとうまくいきます。

df<-data.frame(x1=c(1:5),y1=c(2.0,5.4,7.1,4.6,5.0),y2=c(0.4,9.4,2.9,5.4,1.1),y3=c(2.4,6.6,8.1,5.6,6.3))

ggplot(data=df,aes(df[,1]))+geom_line(aes(y=df[,2]))+geom_line(aes(y=df[,3]))

単一の関数を使用して、使用可能なすべての列を 1 でプロットする方法はありますか?

私はこの方法でそれをやろうとしましたが、うまくいきません:

    plotAllLayers<-function(df){
    p<-ggplot(data=df,aes(df[,1]))
    for(i in seq(2:ncol(df))){ 
        p<-p+geom_line(aes(y=df[,i]))
        }
        return(p)
    }

plotAllLayers(df)
4

4 に答える 4

16

melt()1 つのアプローチは、ライブラリの関数を使用して、ワイド フォーマットからロング フォーマットにデータ フレームを再形成することですreshape2。新しいデータフレームには、どの列データから来たかを決定するx1値があり、元のすべての y 値が含まれています。variablevalue

これで、すべてのデータを 1 つでプロットしggplot()geom_line()呼び出して使用variableして、たとえば各行に別々の色を付けることができます。

 library(reshape2)
 df.long<-melt(df,id.vars="x1")
 head(df.long)
  x1 variable value
1  1       y1   2.0
2  2       y1   5.4
3  3       y1   7.1
4  4       y1   4.6
5  5       y1   5.0
6  1       y2   0.4
 ggplot(df.long,aes(x1,value,color=variable))+geom_line()

ここに画像の説明を入力

本当に for() ループを使用したい場合 (最善の方法ではありません)、names(df)[-1]代わりに を使用する必要がありseq()ます。これにより、列名のベクトルが作成されます (最初の列を除く)。次に、名前で列を選択するために内部でgeom_line()使用します。aes_string(y=i)

plotAllLayers<-function(df){
  p<-ggplot(data=df,aes(df[,1]))
  for(i in names(df)[-1]){ 
    p<-p+geom_line(aes_string(y=i))
  }
  return(p)
}

plotAllLayers(df)

ここに画像の説明を入力

于 2013-04-13T13:46:33.003 に答える
10

大規模な乱雑なデータセットで Melt メソッドを試してみたところ、より高速でクリーンなメソッドが必要でした。この for ループは eval() を使用して目的のプロットを作成します。

fields <- names(df_normal) # index, var1, var2, var3, ...

p <- ggplot( aes(x=index), data = df_normal)
for (i in 2:length(fields)) { 
  loop_input = paste("geom_smooth(aes(y=",fields[i],",color='",fields[i],"'))", sep="")
  p <- p + eval(parse(text=loop_input))  
}
p <- p + guides( color = guide_legend(title = "",) )
p

私がテストしたとき、これは大規模な融解データセットよりもはるかに高速に実行されました。

aes_string(y=fields[i], color=fields[i]) メソッドで for ループも試しましたが、色を区別することができませんでした。

于 2015-06-10T09:13:34.340 に答える
2

pivot_longerOPの状況としてはベストだと思います。しかし、今日、私はピボットを受け入れられないように思われる状況にあったため、次のコードを使用してプログラムでレイヤーを作成しました。使用する必要はありませんでしたeval()

data_tibble <- tibble(my_var = c(650, 1040, 1060, 1150, 1180, 1220, 1280, 1430, 1440, 1440, 1470, 1470, 1480, 1490, 1520, 1550, 1560, 1560, 1600, 1600, 1610, 1630, 1660, 1740, 1780, 1800, 1810, 1820, 1830, 1870, 1910, 1910, 1930, 1940, 1940, 1940, 1980, 1990, 2000, 2060, 2080, 2080, 2090, 2100, 2120, 2140, 2160, 2240, 2260, 2320, 2430, 2440, 2540, 2550, 2560, 2570, 2610, 2660, 2680, 2700, 2700, 2720, 2730, 2790, 2820, 2880, 2910, 2970, 2970, 3030, 3050, 3060, 3080, 3120, 3160, 3200, 3280, 3290, 3310, 3320, 3340, 3350, 3400, 3430, 3540, 3550, 3580, 3580, 3620, 3640, 3650, 3710, 3820, 3820, 3870, 3980, 4060, 4070, 4160, 4170, 4170, 4220, 4300, 4320, 4350, 4390, 4430, 4450, 4500, 4650, 4650, 5080, 5160, 5160, 5460, 5490, 5670, 5680, 5760, 5960, 5980, 6060, 6120, 6190, 6480, 6760, 7750, 8390, 9560))

# This is a normal histogram
plot <- data_tibble %>%
  ggplot() +
  geom_histogram(aes(x=my_var, y = ..density..))

# We prepare layers to add
stat_layers <- tibble(distribution = c("lognormal", "gamma", "normal"),
                     fun = c(dlnorm, dgamma, dnorm),
                     colour = c("red", "green", "yellow")) %>% 
  mutate(args = map(distribution, MASS::fitdistr, x=data_tibble$my_var)) %>% 
  mutate(args = map(args, ~as.list(.$estimate))) %>% 
  select(-distribution) %>% 
  pmap(stat_function)

# Final Plot
plot + stat_layers

アイデアは、geom/stat 関数にプラグインする引数を使用して tibble を整理することです。各行は+、ggplot に追加するレイヤーに対応する必要があります。次に、を使用しますpmap。これにより、プロットに簡単に追加できるレイヤーのリストが作成されます。

于 2020-10-21T19:17:00.317 に答える