次の最初の3列のデータセットがあります。バスケットID(一意の識別子)、販売額(ドル)、および取引日を含めます。データセットの各行について次の列を計算したいのですが、Pythonで計算したいと思います。
同じバスケットの以前の販売(ある場合)。現在のバスケットの現在までの販売数。現在のバスケットの現在までの平均(利用可能な場合)。現在のバスケットの最大現在日(利用可能な場合)
Basket Sale Date PrevSale SaleCount MeanToDate MaxToDate
88 $15 3/01/2012 1
88 $30 11/02/2012 $15 2 $23 $30
88 $16 16/08/2012 $30 3 $20 $30
123 $90 18/06/2012 1
477 $77 19/08/2012 1
477 $57 11/12/2012 $77 2 $67 $77
566 $90 6/07/2012 1
私はPythonにかなり慣れていないので、派手な方法でそれを行うために何かを見つけるのに本当に苦労しています。データを(上記のように)BasketIDとDateで並べ替えたので、バスケットごとに1つずつ進めることで、以前の販売をまとめて取得できます。ループする以外に効率的な方法でMeanToDateとMaxToDateを取得する方法の手がかりはありません...何かアイデアはありますか?