tm パッケージを使用すると、次のように実行できます。
c0 <- Corpus(VectorSource(text))
c0 <- tm_map(c0, removeWords, c(stopwords("english"),mystopwords))
mystopwords
削除したい追加のストップワードのベクトルです。
しかし、RTextTools パッケージを使用して同等の方法を見つけることができません。例えば:
dtm <- create_matrix(text,language="english",
removePunctuation=T,
stripWhitespace=T,
toLower=T,
removeStopwords=T, #no clear way to specify a custom list here!
stemWords=T)
これを行うことは可能ですか?私はインターフェイスが本当に好きで、RTextTools
に戻らなければならないのは残念tm
です.