DSL 回線のインターネット セッションに関するデータを分析する必要があります。セッション期間がどのように分布しているかを確認したかったのです。これを行う簡単な方法は、すべてのセッションの持続時間の確率密度プロットを作成することから始めることだと思いました。
Rにデータをロードし、density()
関数を使用しました。というわけで、こんな感じでした
plot(density(data$duration), type = "l", col = "blue", main = "Density Plot of Duration",
xlab = "duration(h)", ylab = "probability density")
私はRとこの種の分析が初めてです。これは、グーグルを調べて見つけたものです。プロットを手に入れましたが、いくつか疑問が残りました。これは私がやろうとしていることを行うための正しい機能ですか、それとも他に何かありますか?
プロットでは、Y 軸のスケールが 0 ~ 1.5 であることがわかりました。どうすれば 1.5 になるのかわかりません。0 から 1 にすべきではありませんか?
また、より滑らかな曲線を取得したいと思います。データセットが非常に大きいため、線がギザギザになっています。これを提示するときは、それらを滑らかにした方がいいでしょう。どうすればそれを行うことができますか?