データフレームには、フラグ「0」と「1」の列が多数あります。データフレームをインポートすると、クラス「整数」に属します。
0 は不在を示し、1 はすべての列で存在を示します。
それらをfatorsに変換する必要がありますか?
後で xgboost を使用して予測モデルを構築する予定です。Xgboost は数値列でのみ機能するため、列を因子に変換する場合は、それらをワンホット エンコードして数値に変換する必要があります。
(副次的な質問: 共線性を取り除くために 1 つのホット エンコーディングを行う場合、常に 1 つの列を削除する必要がありますか?)