0

ノイズの多いパフォーマンス数値の一般的な印象を伝えようとしているので、元のデータの黄土平滑化曲線をプロットしたいと思います。データの精度の一部を破棄してもまったく問題ないことを明確に指摘しておく必要があります。私が持っている数字は(ほとんど)繰り返しパターンを形成していることを指摘したいだけです.

これを示したい理由は、すべてのデータを全体として検討したことを証明できるようにするためです。たとえば、1 日をより詳細に調べることは、思ったほど面倒ではありません。

データに対して Smooth.spline と loess を実行しようとしましたが、ggplot の呼び出し方法が原因で失敗したと思います。このコードは実際には関数内にあり、関数内の ggplot への呼び出しは、スコープ動作のようなもののために間違っているように見えるため、ggplot と ggsave の奇妙な呪文を実行する必要があると思います (これはあまり詳しく見ていません。 R のスコープを理解していない)。

私が試していることを示すコード例を次に示します。

library("ggplot2")
library("reshape2")


iops_october <- read.csv("iops_oct.csv", header=TRUE)
iops_october <- subset(iops_october, select=c("read_iops", "write_iops", "total_iops", "time"))
iops_october$time <- as.POSIXct(iops_october$time, format="%Y-%m-%d %H:%M:%S")


molten_iops  <- melt(iops_october, id.vars="time")

#plot = ggplot(data=molten_iops, aes(x=time, y=value, color=variable)) + geom_line() + lines(smooth.spline(iops$time, iops$wrie_iops))
plot = ggplot(data=molten_iops, aes(x=time, y=value, color=variable)) + geom_line()

ggsave("october.svg", plot=plot, width=64, height=24, limitsize=FALSE)

これには少しのデータが必要なので、ここで~100kbyte のファイルを見つけることができます

私の最終的な目的は、時間に基づいてすべての数値を平均化すること (日付コンポーネントを破棄すること) だと思いますが、追加の as.time 列を作成し、その「時間」をグループ。

4

0 に答える 0