次のようなデータフレームがあります
user time15min name is_purchase
A 2015-08-18 16:45:00 Words With Friends 0
A 2015-08-18 16:45:00 Clash of Clans 0
A 2015-08-18 16:45:00 Words With Friends 0
A 2015-08-18 16:45:00 Clash of Clans 1
A 2015-08-18 17:00:00 Sudoku 0
B 2015-08-18 17:00:00 Angry Birds 0
B 2015-08-18 17:00:00 Candy Crush 0
B 2015-08-18 17:00:00 Candy Crush 0
....
このtime15min
列には、ユーザーが携帯電話でゲームをプレイした 15 分のバケットが含まれています。
私がする必要があるのは、各ユーザーと各 time15min スロットについて、どのゲームが最もプレイされたかを示す列と、その間にアプリ内購入があったかどうかを示す集計データフレームを作成することです。
したがって、結果は次のようになります
user time15min name purchase_made
A 2015-08-18 16:45:00 Clash of Clans 1
A 2015-08-18 17:00:00 Sudoku 0
B 2015-08-18 17:00:00 Candy Crush 0
A の最初のケースのように同点の場合は、最初のアルファベット順のもの (この場合はクラッシュ オブ クラン) を取ることができます。