データフレーム 16k レコードと、国やその他のフィールドの複数のグループがあります。以下のスニピットのようなデータの初期出力を生成しました。ここで、データのクレンジング、操作、スキューや異常値の削除、特定のルールに基づく値への置換を行う必要があります。
つまり、以下では、歪んだポイント (1 より大きい任意の値) を特定し、それらを次の 2 つのレコードまたは前のレコードの平均に置き換えることができます (そのグループ内に) 後のレコードがない場合。
したがって、以下のデータフレームで、IT の週 1 の Bill%4 の 1.21 を IT の週 2 と週 3 の平均に置き換えて、0.81 にします。
このためのトリックはありますか?
Country Week Bill%1 Bill%2 Bill%3 Bill%4 Bill%5 Bill%6
IT week1 0.94 0.88 0.85 1.21 0.77 0.75
IT week2 0.93 0.88 1.25 0.80 0.77 0.72
IT week3 0.94 1.33 0.85 0.82 0.76 0.76
IT week4 1.39 0.89 0.86 0.80 0.80 0.76
FR week1 0.92 0.86 0.82 1.18 0.75 0.73
FR week2 0.91 0.86 1.22 0.78 0.75 0.71
FR week3 0.92 1.29 0.83 0.80 0.75 0.75
FR week4 1.35 0.87 0.84 0.78 0.78 0.74