同じカテゴリ列を持つトレーニング データ セットとテスト データ セットがあります。現在、各データセットのカテゴリ列を列挙して、次のように各データセットのカウントプロットサブプロットの 2 つのセットを生成します。
plt.figure(figsize=(20,20))
for i, col in enumerate(cat_features):
plt.subplot(5,2,i+1)
sns.countplot(x=col,data=train, order=('A','B','C','D','E','F','G','H','I','J','K','L','N'))
plt.tight_layout()
私がやりたいことは、Test と Train を並べて比較することです。Cat0 Train の catplot が Cat0 Test と並んでいるサブプロットの 1 セット、次に Cat1 Train のサブプロット catplot が Cat1 Test の隣にある、など。
トレーニング データは次のようになります (小さなサブセット)
cat0 cat1 cat2 cat3 cat4 cat5 cat6 cat7 cat8
A B A A B D A E C
B A A A B B A E A
A A A C B D A B C
A A A C B D A E G
A B A A B B A E C
訓練データ
cat0 cat1 cat2 cat3 cat4 cat5 cat6 cat7 cat8
A B A C B D A E E
A B A C B D A E C
A B A C B D A E C
A A B A B D A E E
A B A A B B A E E