8

テキスト文書をいくつかのカテゴリに分類しようとしています。以下のコードは正常に動作します

matrix[[i]] <- create_matrix(trainingdata[[i]][,1], language="english",removeNumbers=FALSE,stemWords=FALSE,weighting=weightTf,minWordLength=3)                              
container[[i]] <- create_container(matrix[[i]],trainingdata[[i]][,2],trainSize=1:50,testSize=51:100) ,
models[[i]] <- train_models(container[[i]], algorithms=c("MAXENT","SVM"))
results[[i]] = classify_models(container[[i]],models[[i]])

以下のコードを実行して精度、再現率、精度の値を取得しようとすると:

analytic[[i]]  <- create_analytics(container[[i]], results[[i]])

次のエラーが表示されます。

Error in `row.names<-.data.frame`(`*tmp*`, value = c(NA_real_, NA_real_ : 
  duplicate 'row.names' are not allowed

Categoriestextフォーマットです。それらを変換するとcategoriesNumeric上記のコードは正常に機能します。

textカテゴリをフォーマットに保ち、Precision、Recall、Accuracy の値を取得するための回避策はありますか。

私の目的は、マルチクラス分類器の精度、再現率、精度の値、および混同行列を取得することです。Multi-Class Text 分類器の上記の値を取得する他のパッケージはありますか (one vs. all)

4

2 に答える 2