2

私のデータは次の例のようになります。

    dataExample<-data.frame(Time=seq(1:10),
        Data1=runif(10,5.3,7.5),
        Data2=runif(10,4.3,6.5),
        Application=c("Substance1","Substance1","Substance1",
        "Substance1","Substance2","Substance2","Substance2",
        "Substance2","Substance1","Substance1"))
        dataExample

           Time    Data1    Data2 Application
        1     1 6.511573 5.385265  Substance1
        2     2 5.870173 4.512775  Substance1
        3     3 6.822132 5.109790  Substance1
        4     4 5.940528 6.281412  Substance1
        5     5 7.269394 4.680380  Substance2
        6     6 6.122454 6.015899  Substance2
        7     7 5.660429 6.113362  Substance2
        8     8 6.649749 4.344978  Substance2
        9     9 7.252656 4.764667  Substance1
        10   10 7.204440 5.835590  Substance1

とは異なる物質がいつ適用されたかを示したいと思いますdataExample$Application[1]

ここでは、これをプロットする方法を示しますが、ggplot を使用するともっと簡単な方法があると思います。

library(reshape2)
library(ggplot)

plotDataExample<-function(DataFrame){
  longDF<-melt(DataFrame,id.vars=c("Time","Application"))
  p=ggplot(longDF,aes(Time,value,color=variable))+geom_line()

  maxValue=max(longDF$value)
  minValue=min(longDF$value)

  yAppLine=maxValue+((maxValue-minValue)/20)
  xAppLine1=min(longDF$Time[which(longDF$Application!=longDF$Application[1])])
  xAppLine2=max(longDF$Time[which(longDF$Application!=longDF$Application[1])])
  lineData=data.frame(x=c(xAppLine1,xAppLine2),y=c(yAppLine,yAppLine))

  xAppText=xAppLine1+(xAppLine2-xAppLine1)/2
  yAppText=yAppLine+((maxValue-minValue)/20)
  appText=longDF$Application[which(longDF$Application!=longDF$Application[1])[1]]
  textData=data.frame(x=xAppText,y=yAppText,appText=appText)

  p=p+geom_line(data=lineData,aes(x=x, y=y),color="black")
  p=p+geom_text(data=textData,aes(x=x,y=y,label = appText),color="black")
  return(p)
}
plotDataExample(dataExample)

ここに画像の説明を入力

質問: 複数の要因 (例: Substance3、Substance4 ...) を示すことができるように、同様の結果を得るためのより良い方法を知っていますか?

4

1 に答える 1

1

まず、新しいサンプル データを 2 レベル以上で 2 回繰り返すように作成しSubstance2ました。

dataExample<-data.frame(Time=seq(1:10),
                        Data1=runif(10,5.3,7.5),
                        Data2=runif(10,4.3,6.5),
                        Application=c("Substance1","Substance1","Substance2",
                                      "Substance2","Substance1","Substance1","Substance2",
                                      "Substance2","Substance3","Substance3"))

各ステップを示す関数としてこれを作成しませんでした。

新しい列groupsを元のデータ フレームに追加します - これにはグループ化の識別子が含まれますApplications- 物質が変更された場合、新しいグループが形成されます。

dataExample$groups<-c(cumsum(c(1,tail(dataExample$Application,n=-1)!=head(dataExample$Application,n=-1))))

データ行の長形式データに変換します。

longDF<-melt(dataExample,id.vars=c("Time","Application","groups"))

物質識別子の位置を計算します。ddply()ライブラリの関数を使用しましplyrた。Application計算には、最初の値とは異なるデータのみが使用されます (つまりsubset())。次にApplicationgroupsデータのグループ化に使用されます。x 軸上の開始位置、中間位置、終了位置を計算し、y 値を最大value+0.3 とします。

library(plyr)    
lineData<-ddply(subset(dataExample,Application != dataExample$Application[1]),
      .(Application,groups),
                summarise,minT=min(Time),maxT=max(Time),
                meanT=mean(Time),ypos=max(longDF$value)+0.3)

ggplot()と でlongDF データをプロットし、新しいデータ フレームを使用して でプロットとテキストgeom_line()の上にセグメントを追加します。geom_segment()annotate()lineData

ggplot(longDF,aes(Time,value,color=variable))+geom_line()+
  geom_segment(data=lineData,aes(x=minT,xend=maxT,y=ypos,yend=ypos),inherit.aes=FALSE)+
  annotate("text",x=lineData$meanT,y=lineData$ypos+0.1,label=lineData$Application)

ここに画像の説明を入力

于 2013-04-17T12:54:32.347 に答える