列 ID の pdf をプロットしようとしている 3 つの列を持つデータセットがあります。私のデータの一部は次のようになります。
day ID count
8754 48112050 1
8975 48112050 3
8327 61010046 2
8346 61010046 3997
8506 61010046 1
8605 61010046 1
これにはqplotを使用します:
qplot(count, colour=factor(ID), data=df, geom="density")
またはggplot:
ggplot(df, aes(x=count, colour= ID))+geom_density()
ただし、すべての ID の pdf をプロットするわけではありません。掘り下げてみると、qplot または ggplot によって生成されたプロットでは、データ内で 2 回しか出現しないID のみが欠落していることに気付きました。この例では、ID:48112050 です。
この ID のみの密度をプロットすると、うまくいきます。
day ID count
8754 48112050 1
8975 48112050 3
ただし、df をこの ID、または 2 回だけ出現する ID のみを含めるように制限すると、qplot または ggplot で次のエラーが表示されます。
Error in exists(name, envir = env, mode = mode) :
argument "env" is missing, with no default
これは、qplot/ggplot が密度関数をプロットするために少なくとも 3 つの点を必要とすることを意味しますか?