複数のcsvからRでデータベースを構築しようとしています。各 csv には NA が分散しており、すべての csv を 1 つのデータベースにまとめたマスター リストを作成したいと考えています。これは私の問題を示す簡単なコードです (ほとんどの csv には実際には数千のエントリがあり、このプロセスを自動化したいと考えています)。
d1=data.frame(common=letters[1:5],species=paste(LETTERS[1:5],letters[1:5],sep='.'))
d1$species[1]=NA
d1$common[2]=NA
d2=data.frame(common=letters[1:5],id=1:5)
d2$id[3]=NA
d3=data.frame(species=paste(LETTERS[1:5],letters[1:5],sep='.'),id=1:5)
利用可能な情報を簡潔に要約するために、あまり運がなくてもマージとリシェイプ (メルト/キャスト) を使用しようとして、円を描いて (ループを書いて) います。これは非常に基本的なようですが、良い方法がわかりません。前もって感謝します。
To be clear, I am aiming for a final database like this:
common species id
1 a A.a 1
2 b B.b 2
3 c C.c 3
4 d D.d 4
5 e E.e 5