以下に作成された次のデータフレームがあります。
temp <- as.data.frame(with(uadm, table(prlo_state_code)))
11個のダミー変数を作成しようとしています。トップ10のそれぞれに1つと「その他」。トップ10は、次の方法で簡単に見つけることができます。
#top10
temp <- temp[order(temp$Freq, decreasing=T),]
head(temp, n=10)
Rが素晴らしいことはわかっているので、トップ10からダミー変数を自動作成(および名前付け)し、残りを「その他」と呼ばれる最終ダミーに折りたたむのは簡単だと思います。
ヘルプや洞察を事前に感謝します。