次のようなCSVデータセットがあります。
Age;Functions;...
12;1,2,5;...
45;1,4,5,8;...
23;3;...
最初の列は参加者の年齢で、2番目の列は質問1の複数の選択肢の回答のコンマ区切りリストです。この例では、最初の参加者は1番目、2番目、5番目のチェックボックスをオンにし、3番目の参加者は3番目のチェックボックスのみをチェックします。 。
ここで、質問1の回答を評価したいと思います。最初のステップは、考えられるすべての回答の回答数をプロットすることです。私は次のことを試しました:
dataset$Functions <- strsplit(as.character(dataset$Functions), ",", fixed=T)
dataset$Functions <- lapply(dataset$Functions, factor, levels = 0:8, labels=c(
"no answer",
"checkbox 1",
"checkbox 2",
"checkbox 3",
"checkbox 4",
"checkbox 5",
"checkbox 6",
"checkbox 7",
"checkbox 8",
))
さらに、mChoiceを使用しようとしました:
library("Hmisc")
dataset$Functions <- lapply(dataset$Functions, mChoice, label="Functions")
しかし今、私はデータフレームでリストを処理する方法がわかりません。アイデアはありますか?