Var1
カテゴリ予測変数&を含むバイナリ分類の問題がありますVar2
。
> head(traindata)
# ID Var1 Var2 response
# 1 101 -2 0 0
# 2 201 0 -1 1
# 3 301 0 -2 0
# 4 401 -1 0 0
# 6 501 0 -1 1
トレーニング セットには の-2,-1,0
レベルとしてすべてが含まれますが、テスト セットにはの入力としてVar1
含まれません。-1
Var1
Var1
テスト セットのすべてのレベルが含まれていることを確認しました。
testdata$Var1 <- factor(testdata$Var1, levels = levels(traindata$Var1)
-1
したがって、テスト データがそのレコードに含まれていなくても、空白因子レベルは存在します。
しかし、次を使用してテスト セットのタスクを作成しようとすると:
testtask <- makeClassifTask(data = testdata, target = "response", positive = "1")
列の空の因子レベルが削除されたことを示す警告が表示されます。Var1
fixup.data = "no"
パラメータも設定してみました。次のエラーが発生します。
testtask <- makeClassifTask(data = testdata, target = "response", positive = "1", fixup.data = "no")
# Error in (function (cn, x) :
# Column 'Var1' contains empty factor levels.
PS: テスト データを自分でリサンプリングしているのではありません。これは、応答変数がわからない外部データ セットです。
また、タスクを作成する前に、テスト セットの応答変数のダミー値を再コーディングしました。