特定のグループの最後の有効な値でデータ フレームの NaN を埋めたいと考えています。例えば:
import pandas as pd
import random as randy
import numpy as np
df_size = int(1e1)
df = pd.DataFrame({'category': randy.sample(np.repeat(['Strawberry','Apple',],df_size),df_size), 'values': randy.sample(np.repeat([np.NaN,0,1],df_size),df_size)}, index=randy.sample(np.arange(0,10),df_size)).sort_index(by=['category'], ascending=[True])
提供するもの:
category value
7 Apple NaN
6 Apple 1
4 Apple 0
5 Apple NaN
1 Apple NaN
0 Strawberry 1
8 Strawberry NaN
2 Strawberry 0
3 Strawberry 0
9 Strawberry NaN
そして、計算したい列は次のようになります。
category value last_value
7 Apple NaN NaN
6 Apple 1 NaN
4 Apple 0 1
5 Apple NaN 0
1 Apple NaN 0
0 Strawberry 1 NaN
8 Strawberry NaN 1
2 Strawberry 0 1
3 Strawberry 0 0
9 Strawberry NaN 0
試しshift()
てみiterrows()
ましたが、役に立ちませんでした。