次のようなデータセットがあります。
id1 id2 size
1 5400 5505 7
2 5033 5458 1
3 5452 2873 24
4 5452 5213 2
5 5452 4242 26
6 4823 4823 4
7 5505 5400 11
ここで、id1
およびはid2
グラフ内の一意のノードであり、それらをからに接続する有向エッジsize
に割り当てられた値です。このデータセットはかなり大きいです(200万行強)。私がやりたいのは、との順序付けられていないノードのペアでグループ化されたサイズ列を合計することです。たとえば、最初の行にはとがあります。データフレームに別の行があり、ここでと。グループ化されたデータでは、これら2つの行のサイズ列の合計が1つの行に追加されます。つまり、(id1、id2)の(順序付けされていない)セットでグループ化しているデータを要約したいと思います。私はこれを使用してこれを行う方法を見つけました id1
id2
id1
id2
id1=5400
id2=5505
id1=5505
id2=5400
apply
完全なデータセットの逆の列ペアをチェックするカスタム関数を使用しますが、これは非常に低速で動作します。誰かがこれを別の方法で行う方法を知っていますか?おそらく、plyr
より効率的な基本パッケージの何かを使って、またはそれを使って。