次のようなデータがあります。
V1 V2
1 10001 1003
2 10002 1005
3 10002 1007
4 10003 1001
5 10003 1005
...
これらはエッジ リスト データです。
V1 のインデックスは非常にまばらで、[1..10001] 内のいくつかの数字だけが占められています。
たとえば、次のようなものですmax(V1) = 20000 but range(V1) = [10000, 20000].
インデックスを圧縮したい。
これが私がやったことです:
sorted <- sort(data, index.return = T)
ただし、ノード インデックスが重複している場合は、異なるソート済みインデックスが返されます。また、返されたインデックス (または、sorted$ix) の逆インデックスも必要です。
私はRを初めて使用しますが、どうすればよいですか?