0

私はtmRでパッケージ化するのが初めてです。コーパスで次のコードを実行していますが、の出力はDocumentTermMatrixすべての用語を考慮していません。

corpus = Corpus(VectorSource(text))
corpus = tm_map(corpus, PlainTextDocument)
dtm = DocumentTermMatrix(corpus)
dtm
# DocumentTermMatrix (documents: 20517, terms: 2)

データセットに 15 を超える用語があるのに、2 つの用語しか表示されません。誰でもここで助けてもらえますか?

4

0 に答える 0