私は、反人身売買組織に関する情報を含むデータセットを使用しています。組織は、組織名または組織のホームページのWebアドレスのいずれかによって識別されます。このデータフレームをケースバイケースで条件付きで折りたたんで、一意の識別子のセット(私のデータの場合は、組織の名前または組織のWebアドレス)を残したいと思います。各ケースについて、これらのケースの約1000以上の数値属性は、折りたたむ前に識別子が関連付けられていた行の最大値または最小値のいずれかです。これを例証するために、私は回したいと思います:
> df1
x y z
Item1 0 3
Item1 1 4
Item2 1 2
Item3 1 3
Item2 1 5
Item3 1 2
Item4 0 2
のようなものに
> df2
x y z
Item1 1 3
Item2 1 2
Item3 1 2
Item4 0 2
もちろん、この例では、Var2の最大値とVar3の最小値を維持し、一意のVar1値のみを保持したいと思います。
大規模なデータセットに対してこれを行うための体系的な方法を誰かが提案できますか?よろしくお願いします!