これはやや複雑です (少なくとも私にとっては)。
これが私がしなければならないことです: 次のデータセットがあるとします:
date price volume
02-Sep 40 100
03-Sep 45 200
04-Sep 46 150
05-Sep 43 300
データセットに間隔を作成したいブレークポイントがあるとします。たとえば、ブレークポイント = 200 ボリューム トランザクションとします。
私が望むのは、ID 列を作成し、ブレークポイントごとに ID 変数 =1,2,3,... を記録することです = 200.ID ごとのすべてのボリュームを合計すると、値はすべての ID 変数で一定でなければなりません。
上記の例を使用すると、最終的なデータセットは次のようになります。
date price volume id
02-Sep 40 100 1
03-Sep 45 100 1
03-Sep 45 100 2
04-Sep 46 100 2
04-Sep 46 50 3
05-Sep 43 150 3
05-Sep 43 150 4
(最後の行はいくつかの値を見逃す可能性がありますが、それは問題ありません。最後の ID を追い出します)
ご覧のとおり、すべての ID のボリュームの合計 200 を一定の値にするために、いくつかの行を「分解」する必要がありました (たとえば、2 行目のように、200 を 2 つの 100 ボリュームに分割します)。