アメリカでのネーミングの傾向に関するデータを探していました。2008 年に生まれた赤ちゃんの名前のトップ 1000 を取得することができました。データは次の形式でフォーマットされています。
male.name n.male female.name n.female
Jacob 22272 Emma 18587
Michael 20298 Isabella 18377
Ethan 20004 Emily 17217
Joshua 18924 Madison 16853
Daniel 18717 Ava 16850
Alexander 18423 Olivia 16845
Anthony 18158 Sophia 15887
William 18149 Abigail 14901
Christopher 17783 Elizabeth 11815
Matthew 17337 Chloe 11699
data.frame
と の2 つの変数name
を取得したいgender
。これはループで実行できますが、この問題を解決するにはかなり非効率的な方法だと思います。いくつかのreshape
機能が私のニーズに合うと思います。
data.frame
このタブ区切りのデータが名前付きで保存されていると仮定しましょうbnames
。ループは関数で行うことができます:
tmp <- character()
for (i in 1:nrow(bnames)) {
tmp <- c(tmp, rep(bnames[i,1], bnames[i,2]))
}
しかし、ベクトルベースのアプローチでこれを達成したいと考えています。助言がありますか?