0

パッケージの実験を始めたばかりでmlr、モデルのトレーニングのしやすさやパッケージでできるその他すべてのことが気に入っています。

feature selectionただし、このコードの最後の部分であるセクションで立ち往生しています。私がやろうとしているのはvarianceメソッドを適用することgenerateFilterValuesData()であり、分散は数値にのみ適用できることを知っているのでinbuilt parameter、データをデータ型でサブセット化し、関数を適用できるかどうかを調べようとしています以下のタスク。

library(data.table)
library(dplyr)
library(mlr)

data(BreastCancer, package = "mlbench")
df = BreastCancer

df$Id = NULL #unimportant feature
names(df) <- tolower(names(df))

cols = c(1:5)
df[,cols] = sapply(cols, function(x){df[,x] = as.integer(df[,x])})
glimpse(df)


classif.task= makeClassifTask(id = 'BreastCancer',data = df,
                              target = 'class')
#task is created
classif.task


#imputation
imp = impute(classif.task,cols = list(bare.nuclei = imputeMode()))

#feature importance
feature.imp = generateFilterValuesData(task = imp$task,
                          method = c('variance'))
4

1 に答える 1