R.3.3.1 の BradleyTerry2 パッケージを使用して、コンテスト固有の変数をデータ分析に含めようとしています (古いバージョンの BradleyTerry2 と比較するために、R.2.11.1 も試しました)。私が直面している問題は、予測変数が適切に考慮されていないことです。以下の例は、私の主張を説明するために CEMS データを使用して、私の問題を示しています。
CEMS.BTmodel_01 <- BTm(outcome = cbind(win1.adj, win2.adj),
player1 = school1,
player2 = school2,
formula = ~ .. + WOR[student] * LAT[..],
refcat = "Stockholm",
data = CEMS)
summary(CEMS.BTmodel_01)
このモデルでは、AIC = 5837.4、LAT[..] * WOR[学生] = 0.85771 と推定される相互作用が得られます。
ここで、新しい学校 (トゥールーズ、LAT = 1) をリストの一番上に追加すると、
Toulouse <- c(1,0,0,0,0,0,0)
Barcelona <- c(0,1,0,0,0,0,0)
London <- c(0,0,1,0,0,0,0)
Milano <- c(0,0,0,1,0,0,0)
Paris <- c(0,0,0,0,1,0,0)
St.Gallen <- c(0,0,0,0,0,1,0)
Stockholm <- c(0,0,0,0,0,0,1)
LAT <- c(1,1,0,1,1,0,0)
schools <- data.frame(Toulouse, Barcelona, London, Milano, Paris, St.Gallen, Stockholm, LAT)
rownames(schools) <- c("Toulouse", "Barcelona", "London", "Milano", "Paris", "St.Gallen", "Stockholm")
CEMS$schools <- schools
新しい学校はデータセットに表示されないため、分析から同じ結果が得られると予想されます。しかし、実際には AIC = 5855.8、相互作用 LAT[..] * WOR[student] = 0.13199 を取得します。
データをいじってみると、予測変数の名前 (ここでは学校の名前) が適切に考慮されておらず、私の比較データ (ここではヨーロッパの学生のペアごとの比較) と一致していないようです。代わりに、重要なのはそれらの順序です。
私が間違っていることは何ですか?