1

R.3.3.1 の BradleyTerry2 パッケージを使用して、コンテスト固有の変数をデータ分析に含めようとしています (古いバージョンの BradleyTerry2 と比較するために、R.2.11.1 も試しました)。私が直面している問題は、予測変数が適切に考慮されていないことです。以下の例は、私の主張を説明するために CEMS データを使用して、私の問題を示しています。

    CEMS.BTmodel_01 <- BTm(outcome = cbind(win1.adj, win2.adj),
        player1 = school1, 
        player2 = school2, 
        formula = ~ .. + WOR[student] * LAT[..], 
        refcat = "Stockholm", 
        data = CEMS)
    summary(CEMS.BTmodel_01)

このモデルでは、AIC = 5837.4、LAT[..] * WOR[学生] = 0.85771 と推定される相互作用が得られます。

ここで、新しい学校 (トゥールーズ、LAT = 1) をリストの一番上に追加すると、

    Toulouse <- c(1,0,0,0,0,0,0)
    Barcelona <- c(0,1,0,0,0,0,0)
    London <- c(0,0,1,0,0,0,0)
    Milano <- c(0,0,0,1,0,0,0)
    Paris <- c(0,0,0,0,1,0,0)
    St.Gallen <- c(0,0,0,0,0,1,0)
    Stockholm <- c(0,0,0,0,0,0,1)
    LAT <- c(1,1,0,1,1,0,0)
    schools <- data.frame(Toulouse, Barcelona, London, Milano, Paris, St.Gallen, Stockholm, LAT)
    rownames(schools) <- c("Toulouse", "Barcelona", "London", "Milano", "Paris", "St.Gallen", "Stockholm")
    CEMS$schools <- schools

新しい学校はデータセットに表示されないため、分析から同じ結果が得られると予想されます。しかし、実際には AIC = 5855.8、相互作用 LAT[..] * WOR[student] = 0.13199 を取得します。

データをいじってみると、予測変数の名前 (ここでは学校の名前) が適切に考慮されておらず、私の比較データ (ここではヨーロッパの学生のペアごとの比較) と一致していないようです。代わりに、重要なのはそれらの順序です。

私が間違っていることは何ですか?

4

1 に答える 1