python - Python scikit LearnのStratifyとStratifiedKFoldの違いは何ですか?

翻译自：https://stackoverflow.com/questions/48403239 2018-01-23T13:44:29.637

1003 次

私のデータは、99% のターゲット変数 = 1 と 1% のターゲット変数 = '0' で構成されています。階層化は、トレーニングテストとテストセットのデータの比率がターゲット変数に関して等しいことを保証します。コンテナのように、「1」と「0」は同量ですか?

明確にするために、以下のコードを参照してください

 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,stratify=y,random_state=42)

2 に答える 2