1

removeCommonTerms 関数は、TM パッケージ用にここにあります。

removeCommonTerms <- function (x, pct) 
{
    stopifnot(inherits(x, c("DocumentTermMatrix", "TermDocumentMatrix")), 
        is.numeric(pct), pct > 0, pct < 1)
    m <- if (inherits(x, "DocumentTermMatrix")) 
        t(x)
    else x
    t <- table(m$i) < m$ncol * (pct)
    termIndex <- as.numeric(names(t[t]))
    if (inherits(x, "DocumentTermMatrix")) 
        x[, termIndex]
    else x[termIndex, ]
}

ここで、Quanteda パッケージであまりにも一般的な用語を削除したいと思います。Document-feature マトリックスを作成する前に、または document-feature マトリックスを使用して、この削除を行うことができます。

R の Quanteda パッケージであまりにも一般的な用語を削除するには?

4

1 に答える 1