0

次のようなデータフレームがあります

user    time15min             name                  is_purchase
A       2015-08-18 16:45:00   Words With Friends    0
A       2015-08-18 16:45:00   Clash of Clans        0
A       2015-08-18 16:45:00   Words With Friends    0
A       2015-08-18 16:45:00   Clash of Clans        1
A       2015-08-18 17:00:00   Sudoku                0
B       2015-08-18 17:00:00   Angry Birds           0
B       2015-08-18 17:00:00   Candy Crush           0
B       2015-08-18 17:00:00   Candy Crush           0
....

このtime15min列には、ユーザーが携帯電話でゲームをプレイした 15 分のバケットが含まれています。

私がする必要があるのは、各ユーザーと各 time15min スロットについて、どのゲームが最もプレイされたかを示す列と、その間にアプリ内購入があったかどうかを示す集計データフレームを作成することです。

したがって、結果は次のようになります

 user   time15min             name                  purchase_made
  A     2015-08-18 16:45:00   Clash of Clans        1
  A     2015-08-18 17:00:00   Sudoku                0
  B     2015-08-18 17:00:00   Candy Crush           0 

A の最初のケースのように同点の場合は、最初のアルファベット順のもの (この場合はクラッシュ オブ クラン) を取ることができます。

4

1 に答える 1