R で Term Document Matrix を作成しましたが、いくつかの用語の名前を変更したいと考えています。
たとえば、ここ
vector <- "This is a test."
library(tm)
doc.vec <- VectorSource(vector)
doc.corpus <- Corpus(doc.vec)
TDM <- TermDocumentMatrix(doc.corpus)
TDM マトリックスを調べると、次のように出力されます
Docs
Terms 1
test. 1
this 1
ここで、たとえば「test」という名前に変更したいと思います。「何でも」に。その理由は、テキストをマイニングすると、明らかに一緒に属する「ビッグデータ」のような単語があるからです。最初のステップでは、gsub を使用して「ビッグデータ」を「ビッグデータ」に置き換えます。ただし、最終的には、出力を「ビッグデータ」にしたいと考えています。
事前に助けてください。