0

次の構造のデータフレームがあります。

import numpy as np
import pandas as pd

data = {'Group':['1', '1', '2', '2', '3', '3'], 'Value':[1, 2, 3, 4, 5, 6]} 
df = pd.DataFrame(data) 

そのデータフレーム (一意のグループごとに約 4000 の値と 1000 のグループ) を次のような numpy 配列に変換する必要があります (順序は保持されます)。

array([[1, 2],[3, 4],[5,6])

補足: グループの 99% は同じ値のカウントを持っていますが、いくつかは異なるカウントを持っています。一部のパディングが最大まで増加する可能性がある場合。そうすることで、失われたデータを免れることができます。

現時点では、一意の「グループ」値を繰り返し処理し、それらを一緒に numpy.vstack します。それは遅く、エレガントとはほど遠いものです。

4

1 に答える 1