ID 番号列とテキスト列を含むデータセットがあり、quanteda
パッケージを使用してテキスト データに対して LIWC 分析を実行しています。これが私のデータ設定の例です:
mydata<-data.frame(
id=c(19,101,43,12),
text=c("No wonder, then, that ever gathering volume from the mere transit ",
"So that in many cases such a panic did he finally strike, that few ",
"But there were still other and more vital practical influences at work",
"Not even at the present day has the original prestige of the Sperm Whale"),
stringsAsFactors=F
)
を使用してLIWC分析を実行できましたscores <- dfm(as.character(mydata$text), dictionary = liwc)
しかし、結果 ( View(scores)
) を表示すると、最終結果で関数が元の ID 番号 (19、101、43、12) を参照していないことがわかります。代わりに、row.names
列が含まれていますが、説明的でない識別子 (例: "text1"、"text2") が含まれています。
dfm()
関数の出力に ID 番号を含めるにはどうすればよいですか? ありがとうございました!