6

tm パッケージを使用すると、次のように実行できます。

c0 <- Corpus(VectorSource(text))
c0 <- tm_map(c0, removeWords, c(stopwords("english"),mystopwords))

mystopwords削除したい追加のストップワードのベクトルです。

しかし、RTextTools パッケージを使用して同等の方法を見つけることができません。例えば:

dtm <- create_matrix(text,language="english",
             removePunctuation=T,
             stripWhitespace=T,
             toLower=T,
             removeStopwords=T, #no clear way to specify a custom list here!
             stemWords=T)

これを行うことは可能ですか?私はインターフェイスが本当に好きで、RTextToolsに戻らなければならないのは残念tmです.

4

2 に答える 2

0

同じリストにストップ ワードを追加できます。例えば:

c0 <- tm_map(c0, removeWords, c(stopwords("english"),"mystopwords"))
于 2016-08-18T20:32:08.727 に答える