1

同じカテゴリ列を持つトレーニング データ セットとテスト データ セットがあります。現在、各データセットのカテゴリ列を列挙して、次のように各データセットのカウントプロットサブプロットの 2 つのセットを生成します。

plt.figure(figsize=(20,20))
for i, col in enumerate(cat_features):
    plt.subplot(5,2,i+1)
    sns.countplot(x=col,data=train, order=('A','B','C','D','E','F','G','H','I','J','K','L','N'))
plt.tight_layout()

これにより、次のような素敵な図が生成されます (スペースのために、最初の 4 つを示すために切り取ったことに注意してください)。

私がやりたいことは、Test と Train を並べて比較することです。Cat0 Train の catplot が Cat0 Test と並んでいるサブプロットの 1 セット、次に Cat1 Train のサブプロット catplot が Cat1 Test の隣にある、など。

トレーニング データは次のようになります (小さなサブセット)

cat0    cat1    cat2    cat3    cat4    cat5    cat6    cat7    cat8    
                                    
    A    B       A      A       B       D       A       E       C   
    B    A       A      A       B       B       A       E       A   
    A    A       A      C       B       D       A       B       C   
    A    A       A      C       B       D       A       E       G   
    A    B       A      A       B       B       A       E       C   

訓練データ

cat0    cat1    cat2    cat3    cat4    cat5    cat6    cat7    cat8
                            
A       B       A       C       B       D       A       E       E
A       B       A       C       B       D       A       E       C
A       B       A       C       B       D       A       E       C
A       A       B       A       B       D       A       E       E
A       B       A       A       B       B       A       E       E
4

1 に答える 1