RTextTools を使用して、MySQL テーブルから取得したデータをトレーニングおよび分類しています。id
データベース内の各ドキュメントを識別するフィールドがあります。ただし、次のコードを使用すると、id
フィールドは存在しなくなります。
matrix <- create_matrix(cbind(data$text,data$id),
language="english", removeNumbers=TRUE,
removeSparseTerms=.998)
corpus <- create_corpus(matrix,
as.numeric(data$valid),
trainSize=1:750, testSize=751:1000,
virgin=FALSE)
SVM <- train_model(corpus,"SVM")
SVM_CLASSIFY <- classify_model(corpus, SVM)
上記のように、data$id
はプロセス中に失われるようです。IDをデータにリンクしたままにする方法はありますか?