データ/時間とフローの 2 つのパラメーターを持つデータがあります。フローデータは断続的なフローです。時々ゼロの流れがあり、突然流れが始まり、しばらくの間ゼロ以外の値があり、その後流れが再びゼロになるとしましょう。ゼロ以外の値がいつ発生するか、およびゼロ以外の各フローがどれくらい続くかを理解したいです。この場所にサンプル データセットを添付しましたhttps://www.dropbox.com/s/ef1411dq4gyg0cm/sampledataflow.csv
データは1分データです。
次のようにデータをRにインポートできました。
flow <- read.csv("sampledataflow.csv")
summary(flow)
names(flow) <- c("Date","discharge")
flow$Date <- strptime(flow$Date, format="%m/%d/%Y %H:%M")
sapply(flow,class)
plot(flow$Date, flow$discharge,type="l")
分布を確認するためにプロットを作成しましたが、ゼロ以外の各値の頻度をどこから取得し始めるべきかの手がかりを得ることができませんでした。出力テーブルを次のように表示したいと思います。
Date Duration in Minutes
ここでわからないことがあれば教えてください。ありがとう。
追加情報:
最初にゼロ以外の値を確認してから、ゼロ以外の値が再びゼロになるまでに連続していくつあるかを調べる必要があると思います。私が理解したいのは、フローリリース期間です。たとえば。1 日に複数のリリースが行われる可能性があるため、リリースが開始された時刻と、値がゼロになるまでの期間を記録したいと思います。これで問題が少しよく説明されることを願っています。