現在、Roger Koenker のquantreg
パッケージを使用して、R で分位点回帰モデルを実行しています。5 つのレベルを持つ順序付けされたカテゴリ変数と、それぞれ 7 つ、4 つ、および 2 つのカテゴリを持つ 3 つの順序付けされていないカテゴリ変数 (曜日、季節、夜間かどうか) があります。1 から 5 までの 5 つのレベルである順序付けられたカテゴリ変数を除いて、すべてが最初は文字列としてデータ フレームに格納されます。私の変数が呼び出されるdf_prime
ことに注意してください。これは、一部の行が削除された元のデータ フレームであるためです。
df_prime$acuity_id <- ordered(df_prime$acuity_id, c(5, 4, 3, 2, 1))
df_prime$day_of_week <- as.factor(df_prime$day_of_week)
df_prime$season <- as.factor(df_prime$season)
df_prime$is_night <- as.factor(df_prime$is_night)
回帰を実行すると、金曜日がサマリーから完全に削除され、順序付き変数である acuity_id のレベルの 1 つが削除されます。それはおそらくRがダミー変数を作成する方法に関連していますか? 何らかの理由で、seasonWinter の p 値が 1 になっていることに気付きました。
私の出力は次のとおりですが、職場の VM に R があり、コピーして貼り付けることができないため、間隔が異なります。
Value Std. Error t value Pr(>|t|)
(Intercept) 173.20000 5.84510 29.63167 0.00000
day_of_weekMonday 19.33333 3.60107 5.36878 0.00000
day_of_weekSaturday -49.66667 3.41145 -14.55883 0.00000
day_of_weekSunday -42.00000 3.35297 -12.52620 0.00000
day_of_weekThursday 5.33333 3.51831 1.51588 0.12957
day_of_weekTuesday 3.00000 3.51917 0.85247 0.39396
day_of_weekWednesday 1.66667 3.75717 0.44360 0.65734
is_night1 -53.00000 2.04268 -25.94626 0.00000
seasonAutumn 8.00000 4.37771 1.82744 0.06765
seasonSpring -0.66667 4.46209 -0.14941 0.88123
seasonSummer 12.66667 4.40002 2.87877 0.00400
seasonWinter 0.00000 4.36418 0.00000 1.00000
acuity_id.L 37.94733 11.20886 3.38548 0.00071
acuity_id.Q -108.68624 9.48982 -11.45293 0.00000
acuity_id.C -36.36619 5.93905 -6.12324 0.00000
acuity_id^4 25.61773 2.77411 9.23459 0.00000