問題タブ [label-encoding]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

87 問題

0 投票する

1 に答える

4288 参照

python - データフレームのトレーニングとテストに同じラベルエンコーダーを使用する

私は訓練データとテストデータを持つ2つの異なるcsvを持っています。これらの train_features_df と test_features_df から 2 つの異なるデータフレームを作成しました。テストデータとトレーニングデータには複数のカテゴリ列があるため、データセットに適しているので、それらに labelEncoder を適用する必要があることに注意してください。そのため、トレーニングデータとテストデータに個別にラベルエンコーダーを適用しました。トレーニングとテストデータセットの新しいエンコードされた値を出力すると、同じ機能の同じカテゴリ値に対して、新しいエンコードされたデータからの出力が異なることがわかります。つまり、トレーニングデータとテストデータをマージする必要があります。次に、ラベルのエンコーディングを適用してから、それらを再び分離しますか?

上記の出力は以下のとおりです:-

最初の列の値をエンコードした後のトレーニングデータフレームazで最初の列の値が値20に変換されたのに対し、最初の列の値をレベルエンコードした後のテストデータフレームでaz値21に変換されたことがわかります.

2020-07-31T10:46:37.263

1 2 3 4 5 6 7 8 9 10

問題タブ [label-encoding]

python - データフレームのトレーニングとテストに同じラベル エンコーダーを使用する

Reference

python - データフレームのトレーニングとテストに同じラベルエンコーダーを使用する