python - featuretools でデータ漏洩を防ぐ方法

翻译自：https://stackoverflow.com/questions/49711987 2018-04-07T21:05:15.777

1118 次

私は機能ツールが大好きですが、データ漏洩が心配なため、データサイエンスワークフローに組み込むのに苦労しています。

これを防ぐ方法は、トレーニングセットで深い特徴合成を実行してから、適切な値をテストセットに結合し、トレーニングセットに存在しないカテゴリのグループでのみ特徴を計算することだと思います。

漏れを処理するより適切な方法はありますか?

1 に答える 1