groupby を使用し、並行してパンダにフィルターを適用する最も効率的な方法は何でしょうか?
基本的に、私はSQLで同等のものを求めています
select *
...
group by col_name
having condition
このようなコマンドを非常に強力にする条件付き平均、合計、条件付き確率などに至るまで、多くのユースケースがあると思います。
非常に優れたパフォーマンスが必要なので、理想的には、そのようなコマンドは、Python で実行されたいくつかの階層化された操作の結果ではありません。