次のスニペットdata
では、pandas.DataFrame
およびindices
は の列のセットですdata
。データをグループ化した後groupby
、グループの ID に興味がありますが、サイズがしきい値 (たとえば 3) を超えるグループのみです。
group_ids=data.groupby(list(data.columns[list(indices)])).grouper.group_info[0]
では、グループの ID を知っていれば、サイズが 3 以上のグループを見つけるにはどうすればよいでしょうか。特定のサイズのグループの ID のみが必要です。
#TODO: filter out ids from group_ids which correspond to groups with sizes < 3