私はtm
Rでパッケージ化するのが初めてです。コーパスで次のコードを実行していますが、の出力はDocumentTermMatrix
すべての用語を考慮していません。
corpus = Corpus(VectorSource(text))
corpus = tm_map(corpus, PlainTextDocument)
dtm = DocumentTermMatrix(corpus)
dtm
# DocumentTermMatrix (documents: 20517, terms: 2)
データセットに 15 を超える用語があるのに、2 つの用語しか表示されません。誰でもここで助けてもらえますか?