0

私は Python/Pandas を使用しており、以下のデータフレーム (1) があります。これを ID でグループ化し、各 ID に対してリビジョンの各グループのリビジョン番号の最大値を取得して、以下のシリーズ (2) を作成しました。

(1) の最初の 2 列を (2) の対応する列と一致させ、(2) の他の列を適切に [実際には(1)のデータセット、「id」、「revision」、「colour」は必ずしも連続した列ではなく、他の列があります]。

私は基本的に (2) をキーとして扱い、(1) から適切なデータを取得しています。

パンダを使用してこれを行うにはどうすればよいですか?

前もって感謝します。

最大。

(1) データフレーム

ID         Revision Colour
14446   0   red
14446   0   red
14446   0   red
14466   1   red
14466   1   red
14466   0   red
14466   1   red
14466   1   red
14466   0   red
14466   2   red
14466   0   red
14466   1   red
14466   0   red
14471   0   green
14471   0   green
14471   0   green
14471   0   green
14473   0   blue
14473   1   blue
14473   0   blue

(2) シリーズ

ID                   Revision
13125                 1
13213                 0
13266                 0
13276                 0
13277                 1
13278                 0
13280                 2
13285                 0
13287                 1
13288                 0
13291                 1
13292                 1
4

1 に答える 1