私のデータは、99% のターゲット変数 = 1 と 1% のターゲット変数 = '0' で構成されています。階層化は、トレーニング テストとテスト セットのデータの比率がターゲット変数に関して等しいことを保証します。コンテナのように、「1」と「0」は同量ですか?
明確にするために、以下のコードを参照してください
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,stratify=y,random_state=42)