私は、2つの大きな(サイズ>100万/300 KB RDataファイル)データフレームをマージするための効率的な(コンピューターリソースと学習/実装の両方の)方法を探しています。
ベースRの「マージ」とプライアの「結合」は、すべてのメモリを使い果たして、システムを効果的にクラッシュさせているように見えます。
負荷テストデータフレームの例
試してみてください
test.merged<-merge(test, test)
また
test.merged<-join(test, test, type="all")
-
-
次の投稿は、マージと代替案のリストを提供します。
データフレーム(内側、外側、左、右)を結合(マージ)する方法は?
以下により、オブジェクトサイズの検査が可能になります:
https ://heuristically.wordpress.com/2010/01/04/r-memory-usage-statistics-variable/
匿名によって生成されたデータ