removeCommonTerms 関数は、TM パッケージ用にここにあります。
removeCommonTerms <- function (x, pct)
{
stopifnot(inherits(x, c("DocumentTermMatrix", "TermDocumentMatrix")),
is.numeric(pct), pct > 0, pct < 1)
m <- if (inherits(x, "DocumentTermMatrix"))
t(x)
else x
t <- table(m$i) < m$ncol * (pct)
termIndex <- as.numeric(names(t[t]))
if (inherits(x, "DocumentTermMatrix"))
x[, termIndex]
else x[termIndex, ]
}
ここで、Quanteda パッケージであまりにも一般的な用語を削除したいと思います。Document-feature マトリックスを作成する前に、または document-feature マトリックスを使用して、この削除を行うことができます。
R の Quanteda パッケージであまりにも一般的な用語を削除するには?