私は Python/Pandas を使用しており、以下のデータフレーム (1) があります。これを ID でグループ化し、各 ID に対してリビジョンの各グループのリビジョン番号の最大値を取得して、以下のシリーズ (2) を作成しました。
(1) の最初の 2 列を (2) の対応する列と一致させ、(2) の他の列を適切に [実際には(1)のデータセット、「id」、「revision」、「colour」は必ずしも連続した列ではなく、他の列があります]。
私は基本的に (2) をキーとして扱い、(1) から適切なデータを取得しています。
パンダを使用してこれを行うにはどうすればよいですか?
前もって感謝します。
最大。
(1) データフレーム
ID Revision Colour
14446 0 red
14446 0 red
14446 0 red
14466 1 red
14466 1 red
14466 0 red
14466 1 red
14466 1 red
14466 0 red
14466 2 red
14466 0 red
14466 1 red
14466 0 red
14471 0 green
14471 0 green
14471 0 green
14471 0 green
14473 0 blue
14473 1 blue
14473 0 blue
(2) シリーズ
ID Revision
13125 1
13213 0
13266 0
13276 0
13277 1
13278 0
13280 2
13285 0
13287 1
13288 0
13291 1
13292 1