次の形式の関数出力(koRpusから)があります:トークンの総数:887タイプの総数:393
テキストの語彙の多様性の測定MTLD:142.66因子の数:6.22因子のサイズ:0.72 SDトークン/因子:41.55(すべての因子)38(完全な因子のみ)
そして、80の異なるドキュメントのこれらの結果を保存するためのループを作成したいと思います。私は以下を試しました:
for (i in 1:length(infra$tableid)) {
whypar <- paste(infra$whypar [infra[,1] ==i], collapse=" ")
wpi<- removeWords(whypar, stopwords("english"))
as.data.frame(wpi)
write.csv(data.frame(wpi), file= "wp.csv")
tagged.text <- tokenize("wp.csv", lang="en")
res.mtld <- MTLD(tagged.text)
write.csv(data.frame(res.mtld),file="output.csv")
}
インフラは次のとおりです。
tableid 1, 2, 3, ... 80
whypar "I took part because xxx", "I believe that jshfdjk", "jhsadkjhd" ... (N=350)
助けてくれてありがとう