ベイジアン ANOVA を計算して、見出し変数が FirstSteeringTime にどのように影響するかを調べています。これが私のデータセットの例です:
x <- structure(list(FirstSteeringTime = c(0.433389999999999, 0.449999999999989,
0.383199999999988, 0.499899999999997, 0.566800000000001, 0.58329999999998,
0.5, 0.449799999999982, 0.566600000000022, 0.466700000000003,
0.433499999999981, 0.466799999999978, 0.549900000000036, 0.483499999999992,
0.533399999999972, 0.433400000000006, 0.533200000000022, 0.450799999999999,
0.45022, 0.46651, 0.68336, 0.483400000000003, 0.5167, 0.383519999999997,
0.583200000000005, 0.449999999999989, 0.58329999999998, 0.4999,
0.5334, 0.4666, 0.433399999999978, 0.41670000000002, 0.416600000000017,
0.45010000000002, 0.666700000000048, 0.433399999999949, 0.466700000000003,
0.666600000000017, 0.516800000000046, 0.199900000000014, 0.400039999999997,
0.150100000000009, 0.583399999999983, 0.483400000000017, 0.400099999999952,
0.666600000000017, 0.434087937888119, 0.516692671379801, 0.533482992494996,
0.516702632558399), pNum = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 10L, 10L, 10L, 10L), heading = structure(c(4L,
1L, 4L, 3L, 4L, 3L, 4L, 3L, 4L, 1L, 4L, 4L, 4L, 4L, 4L, 3L, 3L,
3L, 4L, 4L, 2L, 3L, 4L, 2L, 1L, 2L, 1L, 3L, 1L, 2L, 4L, 3L, 3L,
4L, 2L, 4L, 4L, 1L, 3L, 4L, 3L, 4L, 3L, 3L, 2L, 3L, 2L, 2L, 2L,
3L), .Label = c("0.5", "1", "1.5", "2"), class = "factor")), row.names = c(NA,
50L), class = "data.frame")
まず、ベイジアン ANOVA モデルを当てはめます。
op <- options(contrasts = c("contr.helmert", "contr.poly"))
fit_aov <- stan_aov(FirstSteeringTime ~ heading, data = x, prior = R2(0.5))
私のモデルは、4 つの予測子があることを示しています。これは、見出し変数のレベルが 0.5、1、1.5、および 2 であるため、正しいです。
fit_aov
stan_aov
family: gaussian [identity]
formula: FirstSteeringTime ~ heading
observations: 50
predictors: 4
------
Median MAD_SD
(Intercept) 0.5 0.0
heading1 0.0 0.0
heading2 0.0 0.0
heading3 0.0 0.0
Auxiliary parameter(s):
Median MAD_SD
R2 0.1 0.1
log-fit_ratio 0.0 0.1
sigma 0.1 0.0
ANOVA-like table:
Median MAD_SD
Mean Sq heading 0.0 0.0
Sample avg. posterior predictive distribution of y:
Median MAD_SD
mean_PPD 0.5 0.0
しかし、実用的等価領域 (ROPE) 間隔を計算し、それを HDI と比較すると、3 つの予測因子しか表示されないように見えますか?
pd <- p_direction(fit_aov)
percentage_in_rope <- rope(fit_aov, ci = 1)
# Visualise the pd
plot(pd)
pd
Parameter pd
(Intercept) 100.00%
heading1 80.35%
heading2 79.47%
heading3 98.78%
log-fit_ratio 60.48%
R2 100.00%
さて、私の最初の考えは、見出し変数の 1 つのレベルの影響は非常に小さいため、HDI を作成するのに十分な大きさではないのではないかということでした。確信はないけど。誰にもアイデアはありますか?また、誰かが対数適合比/R2とは何か、そして彼らが私に言っている情報を説明できますか?
どんな助けでも大歓迎です!