pandasfactorize
関数は、シリーズ内の各一意の値を 0 から始まる順次インデックスに割り当て、各シリーズ エントリが属するインデックスを計算します。
pandas.factorize
複数の列で同等のことを達成したい:
import pandas as pd
df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
pd.factorize(df)[0] # would like [0, 1, 2, 2, 1, 0]
つまり、データ フレームの複数の列にある一意の値の各タプルを特定し、それぞれに順次インデックスを割り当て、データ フレームの各行が属するインデックスを計算したいと考えています。
Factorize
単一の列でのみ機能します。パンダに複数列の同等の機能はありますか?