1

実際の値を含む列を持つデータ フレームがあります。

これらの値を相続人のサイズに応じて分類する追加の列が必要です。たとえば、値が最大値のグループの最小値のグループに属しているかどうかを知りたいです。これら 2 つのグループの要素数を同じにしたいと考えています。

例えば。次の値がある場合:

[1,2,3,4,40,50]

1、2、3 を 1 に、4、40、50 を 2 にマッピングしたいと思います。データ フレームで簡単に行う方法はありますか。

上記の例では、2 つのグループのみを使用しました。しかし、私はそれを柔軟に保ちたいと思います。たとえば、3 つのグループの場合、1 と 2 を 1 に、3 と 4 を 2 に、40 と 50 を 3 にマッピングしたいと思います。

4

1 に答える 1

2
import heapq
import random
x = range(100000)
random.shuffle(x)
print(heapq.nlargest(2, x))

与えます: [99999, 99998]

今すぐ次のようなことをしてください:

max_column = heapq.nlargest(len(x)/2, x)

これにより、リストの半分が「大きな」山になり、小さな山についても同じことが行われます。

于 2013-10-16T10:23:31.617 に答える