1

Var1カテゴリ予測変数&を含むバイナリ分類の問題がありますVar2

> head(traindata)

#  ID   Var1 Var2 response
# 1 101   -2   0      0
# 2 201    0  -1      1
# 3 301    0  -2      0
# 4 401   -1   0      0
# 6 501    0  -1      1

トレーニング セットには の-2,-1,0レベルとしてすべてが含まれますが、テスト セットにはの入力としてVar1含まれません。-1Var1

Var1テスト セットのすべてのレベルが含まれていることを確認しました。

testdata$Var1 <- factor(testdata$Var1, levels = levels(traindata$Var1)

-1したがって、テスト データがそのレコードに含まれていなくても、空白因子レベルは存在します。

しかし、次を使用してテスト セットのタスクを作成しようとすると:

testtask <- makeClassifTask(data = testdata, target = "response", positive = "1")

列の空の因子レベルが削除されたことを示す警告が表示されます。Var1

fixup.data = "no"パラメータも設定してみました。次のエラーが発生します。

testtask <- makeClassifTask(data = testdata, target = "response", positive = "1", fixup.data = "no")

# Error in (function (cn, x)  :
#   Column 'Var1' contains empty factor levels.

PS: テスト データを自分でリサンプリングしているのではありません。これは、応答変数がわからない外部データ セットです。

また、タスクを作成する前に、テスト セットの応答変数のダミー値を再コーディングしました。

4

2 に答える 2