次のDataFrame
ような列があります。
["A_1", "A_2", "A_3", "B_1", "B_2", "B_3"]
さまざまな A 列と B 列をそれぞれ 1 つの列に「折りたたんで」、それらの平均値を計算したいと思います。要するに、操作の最後に次のようになります。
["A", "B"]
ここで、「A」はすべての「A」列の列方向の平均であり、「B」はすべての「B」列の平均です。
私が理解している限り、groupby
このタスクには適していないか、間違って使用している可能性があります:
grouped = data.groupby([item for item in data if "A" not in item])
を使用するaxis=1
と、mean() を呼び出したときに得られるのは空の DataFrame だけです。そうでない場合は、目的の効果が得られません。別の DataFrame を作成して、反復によって手段を埋めることは避けたいと思います (たとえば、手段を個別に計算してから のように追加するなどnew_df["A"] = mean_a
)。これに対する効率的な解決策はありますか?