Benoit の R パッケージ quanteda を使用して、lexisnexis からエクスポートされた記事を分析します。エクスポートは標準の html 形式です。tm パッケージ + プラグインを使用して、lexisnexis の出力を読み取ります。残念ながら、tm-corpus を quanteda-corpus に変換するときにエラーが発生します。その機能は壊れていますか、それとも以前に何か間違っていましたか?
library("tm")
library("tm.plugin.lexisnexis")
library("quanteda")
ln <- LexisNexisSource("lexisnexisOutput.html")
cr <- Corpus(ln)
crp <- corpus(cr)
Error in UseMethod("corpus") :
no applicable method for 'corpus' applied to an object of class "list"
In addition: Warning message:
In corpus(texts, docvars = metad, source = paste("Converted from tm VCorpus '", :
Arguments docvarssource not used.