3 つの変数と 1.425.558 の観測値を持つ data.frame があります。再生可能エネルギー発電所からの設置電力の記録です。各行は、設置された 1 つの発電所を表します。郵便番号エリアには同じタイプの発電所が複数存在する場合があります。
ID zipcode Type power
1 79280 solarpower 3
2 79280 solarpower 3
3 79283 hydroelectric 3
4 79280 biogas 55
5 79280 windpower 2
6 21459 windpower 4
7 21459 windpower 2
太陽光発電/バイオガス/風力発電がどれくらい設置されているかを郵便番号で合計したいと思います。
zipcode Type power
21459 windpower 6
79280 solarpower 6
79280 windpower 2
...and so on.
私はすでに試しました
aggregate(myDat$power, by=list(myDat$zipcode,myDat$type), FUN=sum)
しかし、私のRAMは十分ではありませんでした。
私のデータフレームは非常に大きいです。「2」で始まる郵便番号のデータのみが必要なので、かなり絞り込むことができました。
解決策を教えていただけますか?初心者を助けてくれてありがとう!