私はRを学んでおり、lm()
因子変数を処理する方法とANOVAテーブルを理解する方法を理解しようとしています. 統計初心者なので、お手柔らかにお願いします。
Rotten Tomatoes のムービー データを次に示します。G、PG、PG-13、および R と評価された 4 つのグループのすべての映画の平均スコアに基づいて、各映画のスコアをモデル化しようとしています。
download.file("http://www.rossmanchance.com/iscam2/data/movies03RT.txt", destfile = "./movies.txt")
movies <- read.table("./movies.txt", sep = "\t", header = T, quote = "")
lm1 <- lm(movies$score ~ as.factor(movies$rating))
anova(lm1)
および ANOVA 出力:
## Analysis of Variance Table
##
## Response: movies$score
## Df Sum Sq Mean Sq F value Pr(>F)
## as.factor(movies$rating) 3 570 190 0.92 0.43
## Residuals 136 28149 207
このテーブルのすべての数値を取得する方法を理解しています。例外Sum Sq
とMean Sq
for as.factor(movies$rating)
. Sum Sq
誰かが私のデータからどのように計算されるか説明してもらえますか? で割ったMean Sq
だけだと分かります。Sum Sq
Df