非常に大きなデータ フレーム (数百万レコード) があります。
次のルールにより、フィルター処理する必要があります
。
したがって、ID と x の 2 つの列だけに関心があります。データ フレームは ID でソートされます。
ループを使用するのはかなり簡単ですが、ループはそのような大きなデータ フレームではうまく機能しません。
「ベクタースタイル」でそれを行う方法は?
例:
フィルタリング前
ID x
1 0
1 0
1 5 # First record with x>0
1 0
1 3
1 4
1 0
1 9
1 0 # Delete all earlier records of that product
1 0
1 6
2 0
2 1 # First record with x>0
2 0
2 4
2 5
2 8
2 0 # Delete all earlier records of that product
2 1
2 3
フィルタリング後:
ID x
1 9
1 0
1 0
1 6
2 0
2 1
2 3