1

累積頻度分布時間基準を作成し、プロットを作成することができました。

breaks = seq(as.Date('2013-01-01'),as.Date('2013-11-07'),by = 1)
dates=as.Date(Failures$Event_Date)
cum.freq=cbind.data.frame(table(cut.Date(as.Date(dates), as.Date(breaks), right=FALSE)))
result=cbind.data.frame(cum.freq,cumsum(cum.freq$Freq))
qplot(x=as.Date(Var1), y=cumsum(cum.freq$Freq), data=result,
      xlab="Date", ylab="Cumulative Failures",
      main="Frequency Distribution for failures",
      alpha=I(.5)) + scale_x_date(breaks = date_breaks("4 weeks"),
      labels = date_format("%m/%d"))

オブジェクトが壊れてcut.Date機能することで、サンプル サイズだけでなく、すべてのデータを一定の時間間隔で分散させることができます。これを考慮しないと、曲線とトレンドラインはかなり異なります。

その制限により、カットまたは同様の関数を使用して、名前付きの別の変数Categoryをプロットにデータ系列として追加し、おそらくグループオプションを使用する必要がありますplot

例えば:

Event_Date  Fault_Code  Category
06/10/13    NA  CAT1
17/05/13    10  CAT2
10/07/13    45  CAT3
11/06/13    15  CAT4
11/06/13    15  CAT4
23/08/13    16  CAT5
25/05/13    1   CAT5
28/10/13    1   CAT5
12/09/13    1   CAT5
05/06/13    NA  CAT5
05/06/13    NA  CAT5
12/06/13    NA  CAT5
21/02/13    10  CAT5
25/06/13    NA  CAT5
25/06/13    2   CAT5
17/05/13    2   CAT5

だけでなく、サンプルデータの範囲を分割して使用しcutたり、?cut.DateEvent_DateCategory

別のオプションを使用することもできますが、すべてのブレークを取得するために作成された後をdcast()転置します。Categorycut

4

0 に答える 0