1

RTextTools を使用して、MySQL テーブルから取得したデータをトレーニングおよび分類しています。idデータベース内の各ドキュメントを識別するフィールドがあります。ただし、次のコードを使用すると、idフィールドは存在しなくなります。

matrix <- create_matrix(cbind(data$text,data$id),
language="english", removeNumbers=TRUE,
removeSparseTerms=.998)

corpus <- create_corpus(matrix,
as.numeric(data$valid),
trainSize=1:750, testSize=751:1000,
virgin=FALSE)

SVM <- train_model(corpus,"SVM")

SVM_CLASSIFY <- classify_model(corpus, SVM)

上記のように、data$idはプロセス中に失われるようです。IDをデータにリンクしたままにする方法はありますか?

4

1 に答える 1

0

このコマンドを使用してcbind、ID列を出力に追加し直すことができます。例えば:

output <- cbind(data$id,SVM_CLASSIFY)
于 2012-06-17T00:50:36.837 に答える