0

私はRを学んでおり、lm()因子変数を処理する方法とANOVAテーブルを理解する方法を理解しようとしています. 統計初心者なので、お手柔らかにお願いします。

Rotten Tomatoes のムービー データを次に示します。G、PG、PG-13、および R と評価された 4 つのグループのすべての映画の平均スコアに基づいて、各映画のスコアをモデル化しようとしています。

download.file("http://www.rossmanchance.com/iscam2/data/movies03RT.txt", destfile = "./movies.txt")
movies <- read.table("./movies.txt", sep = "\t", header = T, quote = "")
lm1 <- lm(movies$score ~ as.factor(movies$rating))
anova(lm1)

および ANOVA 出力:

## Analysis of Variance Table
## 
## Response: movies$score
##                           Df Sum Sq Mean Sq F value Pr(>F)
## as.factor(movies$rating)   3    570     190    0.92   0.43
## Residuals                136  28149     207

このテーブルのすべての数値を取得する方法を理解しています。例外Sum SqMean Sqfor as.factor(movies$rating). Sum Sq誰かが私のデータからどのように計算されるか説明してもらえますか? で割ったMean Sqだけだと分かります。Sum SqDf

4

1 に答える 1

1

それを得るにはさまざまな方法があります。それらの 1 つは、次の式を使用することです。

http://en.wikipedia.org/wiki/Sum_of_squares_(統計)

SS_total = SS_reg + SS_error

そう:

y = movies$score
sum((y - mean(y))^2) - sum(lm1$residuals^2)
于 2013-02-13T18:09:32.227 に答える