2

python pandas の groupby と平均値の拡張について助けが必要です。

mean と groupby を展開する pandas を使用しようとしています。下のこの画像では、id 列を使用してグループ化し、平均を日付で展開します。しかし、キャッチは1月のもので、拡張平均を使用していません。たとえば、1 月が過去の 1 か月であると考えて、値の列と ID によるグループ化の全体的な平均を取ることができます。

2 月と 3 月については、1 月の上に拡張平均値列を使用したいと考えています。したがって、2 月 7 日と ID 1 の場合、拡張平均列の 44.5 は基本的に、今日 89 の値が発生する前の 1 月の平均です。ID 1 の次の値は 3 月 7 日です。これには、id = 1 の 2 月 7 日の前の値 89 が含まれます。

したがって、基本的に私の考えは、2月1日までの全体的な平均を取り、その日までに計算された平均の上に拡張平均を使用することです.

id    date    value   count(prior)   expanding mean (after feb)
1     1-Jan    28      4              44.75
2     1-Jan    43      3              37.33
3     1-Jan    69      3              57.00
1     2-Jan    31      4              44.75
2     2-Jan    22      3              37.33
1     7-Jan    82      4              44.75
2     7-Jan    47      3              37.33
3     7-Jan    79      3              57.00
1     8-Jan    38      4              44.75
3     8-Jan    23      3              57.00
1     7-Feb    89      4              44.75
2     7-Feb    22      3              37.33
3     7-Feb    80      3              57.00
2     19-Feb   91      4              33.50
3     19-Feb   97      4              62.75
1     7-Mar    48      5              53.60
2     7-Mar    98      5              45.00
3     7-Mar    35      5              69.60

カウントがどのように増加しているかの参照として、カウント列を指定しました。それは基本的にその日付より前のすべてを意味します。

4

0 に答える 0