一部の分類タスクでは、mlr
パッケージを使用して、次のdata.frame
ようなものを処理する必要があります。
set.seed(pi)
# Dummy data frame
df <- data.frame(
# Repeated values ID
ID = sort(sample(c(0:20), 100, replace = TRUE)),
# Some variables
X1 = runif(10, 1, 10),
# Some Label
Label = sample(c(0,1), 100, replace = TRUE)
)
df
値を同じ にまとめてモデルを相互検証する必要がありますID
。チュートリアルから次のことがわかります。
https://mlr-org.github.io/mlr-tutorial/release/html/task/index.html#さらに設定
タスクにブロック要因を含めることができます。これは、いくつかの観測値が「一緒に属している」ことを示しており、リサンプリングのためにデータをトレーニング セットとテスト セットに分割するときに分離すべきではありません。
問題は、このブロッキング要因をどのように含めることができるmakeClassifTask
かです。
残念ながら、例を見つけることができませんでした。