次のような値を持つ列「cat100」を持つデータフレームがあります。
「A」「B」…「Y」「Z」「AA」「AB」…
AAが「B」「C」...「Z」の後にあるように、pd.factorizeを使用して列を因数分解したいと思います。
私は次のようなことを試しました:
df = pd.DataFrame(['A','B','AA'])
df[0] = pd.factorize(df[0], sort=True)[0]
しかし、これは A を 0 に、B を 2 に、AA を 1 に割り当てます。AA を 2 に、B を 1 に割り当てたいのです。
これを行う方法を検索しましたが、何も見つかりませんでした。これを行う方法はありますか?