3

3 つのデータセットがあります。

応答 - 5 (サンプル) x 10 (従属変数) の行列

予測値 - 5 (サンプル) x 2 (独立変数) の行列

test_set - 10 (サンプル) x 10 (応答で定義された従属変数) の行列

response <- matrix(sample.int(15, size = 5*10, replace = TRUE), nrow = 5, ncol = 10)
colnames(response) <- c("1_DV","2_DV","3_DV","4_DV","5_DV","6_DV","7_DV","8_DV","9_DV","10_DV") 
predictors <- matrix(sample.int(15, size = 7*2, replace = TRUE), nrow = 5, ncol = 2)
colnames(predictors) <- c("1_IV","2_IV")
test_set <- matrix(sample.int(15, size = 10*2, replace = TRUE), nrow = 10, ncol = 2)
colnames(test_set) <- c("1_IV","2_IV")

応答セットと予測子セットの組み合わせとして定義されたトレーニング セットを使用して、多変量線形モデルを実行しています。このモデルを使用して、テスト セットの予測を行いたいと考えています。

training_dataframe <- data.frame(predictors, response)
fit <- lm(response ~ predictors, data = training_dataframe)
predictions <- predict(fit, data.frame(test_set))

ただし、予測の結果は非常に奇妙です。

predictions

まず、行列の次元は 5 x 10 です。これは、DV の数による応答変数のサンプル数です。

私は R でのこの種の分析にあまり熟練していませんが、test_set の各行の予測を行うために、10 x 10 の行列を取得するべきではありませんか?

この問題について何か助けていただければ幸いです、Martin

4

1 に答える 1