研究論文では、なげなわモデルを使用して分類と特徴選択を実行します。ワンホット エンコーディングを使用してカテゴリ データを処理する準備をしており、最終的なモデルに最終的に選択されたフィーチャを判断するために、元のカテゴリ値にマップされるフィーチャを特定する必要があります。私はしばらくこの質問をグーグルで調べてきましたが、答えが見つかりませんでした。
scikit のワンホット エンコーディングはどのように値を割り当てますか? たとえば、特定の変数のカテゴリ値が {1, 2, 3, 4} であるとします。ワンホット エンコーディングはそれらを時系列でダミーに編成しますか (つまり、1 をドロップし、最初のダミーを値 2 に、2 番目のダミーを値 3 に、3 番目のダミーを値 4 にしますか? それとも、見つかった順序に基づいて割り当てますか?行を下にスキャンするときの異なるカテゴリ値 (たとえば、最初の観察の値は 3 で、2 番目の観察の値は 2 であるため、3 は削除され、最初のダミーは値 2 になります)?
ありがとう!