R で最初の 2 つを読み取り、一意の 2 列のペアのみをdata.frame
. ファイルは数百万行になる可能性があります。
cluster-1 3 12412341324 13412341234
cluster-1 3 62626662346 54234524354
cluster-1 3 45454345354 45454544545
cluster-2 644 12332234341 37535473475
cluster-2 644 54654365466 56565634543
cluster-2 644 56356356536 35634563456
...
cluster-9999999 123 123412341241 143132423
...
私はscan
(またはより良いオプション)を使用してファイルを読み取り、最終的には次のようになりたいと思いますdata.frame
:
cluster-1 3
cluster-2 644
cluster-3 343
...
cluster-9999999 123
R でこの大きなファイルを読み取る最も時間効率の良い方法は何でしょうか?