2

Benoit の R パッケージ quanteda を使用して、lexisnexis からエクスポートされた記事を分析します。エクスポートは標準の html 形式です。tm パッケージ + プラグインを使用して、lexisnexis の出力を読み取ります。残念ながら、tm-corpus を quanteda-corpus に変換するときにエラーが発生します。その機能は壊れていますか、それとも以前に何か間違っていましたか?

library("tm")
library("tm.plugin.lexisnexis")
library("quanteda")

ln <- LexisNexisSource("lexisnexisOutput.html")
cr <- Corpus(ln)
crp <- corpus(cr)

Error in UseMethod("corpus") : 
  no applicable method for 'corpus' applied to an object of class "list"
In addition: Warning message:
In corpus(texts, docvars = metad, source = paste("Converted from tm VCorpus '",  :
  Arguments docvarssource not used.
4

1 に答える 1

1

corpus.VCorpus()これは、テキストが単一の char 型ではなく、char 型のベクトルである場合の制限でした。quanteda 0.9.1-6 で修正されました。GitHub の問題 #80 を参照してください。

于 2015-12-28T09:33:46.980 に答える