1

継続sklearn で連続属性の離散化を行う方法は?

トレーニング データからビンを「学習」した後、np.histogram(A['my_var'])それをテスト セットに適用するにはどうすればよいですか? 各データポイントの my_var 属性はどのビンのように? 必要に応じて、トレーニング データとテスト データの両方が pandas データ フレームにあります。

ありがとう

4

1 に答える 1

0

おっとっと。それは簡単です。

hist = np.histogram(A['my_var'])
A.loc[:, 'my_bin'] = np.digitize(A['my_var'], hist[1])
于 2015-09-15T13:18:27.540 に答える