2

3 つの変数と 1.425.558 の観測値を持つ data.frame があります。再生可能エネルギー発電所からの設置電力の記録です。各行は、設置された 1 つの発電所を表します。郵便番号エリアには同じタイプの発電所が複数存在する場合があります。

ID  zipcode     Type    power
1   79280   solarpower  3
2   79280   solarpower  3
3   79283   hydroelectric   3
4   79280   biogas          55
5   79280   windpower   2
6   21459   windpower   4
7   21459   windpower   2

太陽光発電/バイオガス/風力発電がどれくらい設置されているかを郵便番号で合計したいと思います。

zipcode     Type    power
21459        windpower    6
79280        solarpower   6
79280        windpower    2
...and so on.

私はすでに試しました

aggregate(myDat$power, by=list(myDat$zipcode,myDat$type), FUN=sum)

しかし、私のRAMは十分ではありませんでした。

私のデータフレームは非常に大きいです。「2」で始まる郵便番号のデータのみが必要なので、かなり絞り込むことができました。

解決策を教えていただけますか?初心者を助けてくれてありがとう!

4

2 に答える 2