累積頻度分布時間基準を作成し、プロットを作成することができました。
breaks = seq(as.Date('2013-01-01'),as.Date('2013-11-07'),by = 1)
dates=as.Date(Failures$Event_Date)
cum.freq=cbind.data.frame(table(cut.Date(as.Date(dates), as.Date(breaks), right=FALSE)))
result=cbind.data.frame(cum.freq,cumsum(cum.freq$Freq))
qplot(x=as.Date(Var1), y=cumsum(cum.freq$Freq), data=result,
xlab="Date", ylab="Cumulative Failures",
main="Frequency Distribution for failures",
alpha=I(.5)) + scale_x_date(breaks = date_breaks("4 weeks"),
labels = date_format("%m/%d"))
オブジェクトが壊れてcut.Date
機能することで、サンプル サイズだけでなく、すべてのデータを一定の時間間隔で分散させることができます。これを考慮しないと、曲線とトレンドラインはかなり異なります。
その制限により、カットまたは同様の関数を使用して、名前付きの別の変数Category
をプロットにデータ系列として追加し、おそらくグループオプションを使用する必要がありますplot
。
例えば:
Event_Date Fault_Code Category
06/10/13 NA CAT1
17/05/13 10 CAT2
10/07/13 45 CAT3
11/06/13 15 CAT4
11/06/13 15 CAT4
23/08/13 16 CAT5
25/05/13 1 CAT5
28/10/13 1 CAT5
12/09/13 1 CAT5
05/06/13 NA CAT5
05/06/13 NA CAT5
12/06/13 NA CAT5
21/02/13 10 CAT5
25/06/13 NA CAT5
25/06/13 2 CAT5
17/05/13 2 CAT5
だけでなく、サンプルデータの範囲を分割して使用しcut
たり、?cut.Date
Event_Date
Category
別のオプションを使用することもできますが、すべてのブレークを取得するために作成された後をdcast()
転置します。Category
cut