python pandas の groupby と平均値の拡張について助けが必要です。
mean と groupby を展開する pandas を使用しようとしています。下のこの画像では、id 列を使用してグループ化し、平均を日付で展開します。しかし、キャッチは1月のもので、拡張平均を使用していません。たとえば、1 月が過去の 1 か月であると考えて、値の列と ID によるグループ化の全体的な平均を取ることができます。
2 月と 3 月については、1 月の上に拡張平均値列を使用したいと考えています。したがって、2 月 7 日と ID 1 の場合、拡張平均列の 44.5 は基本的に、今日 89 の値が発生する前の 1 月の平均です。ID 1 の次の値は 3 月 7 日です。これには、id = 1 の 2 月 7 日の前の値 89 が含まれます。
したがって、基本的に私の考えは、2月1日までの全体的な平均を取り、その日までに計算された平均の上に拡張平均を使用することです.
id date value count(prior) expanding mean (after feb)
1 1-Jan 28 4 44.75
2 1-Jan 43 3 37.33
3 1-Jan 69 3 57.00
1 2-Jan 31 4 44.75
2 2-Jan 22 3 37.33
1 7-Jan 82 4 44.75
2 7-Jan 47 3 37.33
3 7-Jan 79 3 57.00
1 8-Jan 38 4 44.75
3 8-Jan 23 3 57.00
1 7-Feb 89 4 44.75
2 7-Feb 22 3 37.33
3 7-Feb 80 3 57.00
2 19-Feb 91 4 33.50
3 19-Feb 97 4 62.75
1 7-Mar 48 5 53.60
2 7-Mar 98 5 45.00
3 7-Mar 35 5 69.60
カウントがどのように増加しているかの参照として、カウント列を指定しました。それは基本的にその日付より前のすべてを意味します。