テキスト データに対してマルチラベル マルチクラス分類を実行するモデルをトレーニングする必要があります。
私は現在、このリンクの指示に従って、 R で mlr パッケージを使用して同じことをしようとしています -
1) 他に推奨されるパッケージはありますか?
2) そうでなければ、私はこの場所で立ち往生しています (上記の記事で説明されているように)
classify <- getTaskData(dtmDf) ## dtmDf is my dtm converted to dataframe form
「分類」はNULLです
ヘルプ/指示をいただければ幸いです。
ありがとう。
更新:-「タスク」オブジェクトを作成しようとしています。以下のコード-
dtm <- DocumentTermMatrix(docs)
mat <- as.matrix(dtm)
mat <- cbind(mat,data$Label)
dtmDf <- as.data.frame(mat)
target <- unique(dtmDf[,2628]) %>% as.character() %>% sort()
classify.task = makeMultilabelTask(id = "classif", data = dtmDf, target =target)
次のエラーに直面します -
makeSupervisedTask("multilabel"、data、target、weights、blocking) のエラー: データの列名にターゲット変数が含まれていません: 10
解決した
makeMultilabelTask() 関数への入力として与えられたチュートリアル リンクの酵母データと同様に、入力データ フレームを必要な形式で取得した後、トレーニングすることができました。