R の KDE 関数はどのように実装されているのだろうか。
dates5.csv は次のとおりです。
day
2013-01-02
2013-03-01
つまり、2 つの日付です。ここで、データを読み込み、if から四角形の KDE を計算し、以下のプロットを取得します。
data <- read.csv("dates5.csv", header=T)
days <- data$day
daysPosix <- as.POSIXct(days, tz="Europe/Zurich")
# compute density
ds <- density(as.numeric(daysPosix),
bw = 3600 * 24 * 7,
kernel = "rectangular",
cut = 3)
plot(ds, xaxt ="n", xlab="", ylab="", ylim = c(0,max(ds$y)),
main = "Temporal density (uniform kernel,
bandwidth = 7 days)")
points(x = as.numeric(daysPosix),
y=rep(0, length(daysPosix)),
pch="|",
col="#00000080")
times.seq <- seq(daysPosix[1],
daysPosix[length(daysPosix)],
by = "weeks")
labels = strftime(times.seq, "%d.%m.%y")
axis(1,times.seq,labels)
x 軸の目盛りは週単位で区切られています。一見すると、このプロットは理にかなっています。2 つの点の上に 2 つの長方形が構築されています。それでも、私が理解できないことが 2 つあります:各「形状」のおおよその範囲が 3 週間よりも少し長く、予想どおりの 7 日間ではないのはなぜですか (これは帯域幅なので?)? そして、形の両側には急な「崖」があるのに、垂直にはならないのはなぜですか?