r - Tidyverse を使用して、複数の列にまたがる REDCap データ内の特定の文字列の頻度をカウントする

Question

回答者が調査の質問に対して 1 つ以上の回答を「チェック」することを許可されている REDCap 調査からデータを頻繁に受け取ります。各潜在的な応答は、独自の列に格納されています。各回答オプション（列）がチェックされた頻度をまとめたいと思います。例えば：

library(tidyverse)
set.seed(1234)
responses<-c("Checked", "Unchecked")
numobs<-10

my_example<-data.frame(id=1:10, 
                       Response_Option_A=sample(responses, numobs, replace=TRUE), 
                       Response_Option_B=sample(responses, numobs, replace=TRUE), 
                       Response_Option_C=sample(responses, numobs, replace=TRUE),
                       Response_Option_D=sample(responses, numobs, replace=TRUE),
                       stringsAsFactors = FALSE)

my_example
#>    id Response_Option_A Response_Option_B Response_Option_C Response_Option_D
#> 1   1         Unchecked         Unchecked         Unchecked           Checked
#> 2   2         Unchecked         Unchecked         Unchecked         Unchecked
#> 3   3         Unchecked         Unchecked         Unchecked           Checked
#> 4   4         Unchecked           Checked         Unchecked           Checked
#> 5   5           Checked         Unchecked         Unchecked           Checked
#> 6   6         Unchecked         Unchecked         Unchecked         Unchecked
#> 7   7           Checked         Unchecked           Checked           Checked
#> 8   8           Checked           Checked         Unchecked         Unchecked
#> 9   9           Checked         Unchecked         Unchecked         Unchecked
#> 10 10         Unchecked         Unchecked         Unchecked           Checked

私の最初の傾向はこれを試すことでしたが、各列の数ではなく、チェックされた回答の総数を返します。

my_example %>%
  select(starts_with("Response_Option_")) %>%
    summarise(checked=sum(.=="Checked"))
#>   checked
#> 1      13

^{reprex パッケージ(v0.3.0)で 2020-08-10 に作成}

これらの回答を効率的に要約するのに役立ちます。

r - Tidyverse を使用して、複数の列にまたがる REDCap データ内の特定の文字列の頻度をカウントする

4 に答える 4

Related

Reference