私は、約 4500 の変数を持つバイナリ クラスのランダム フォレストに取り組んでいます。これらの変数の多くは高度に相関しており、元の変数の分位数にすぎないものもあります。次元削減のために PCA を適用することが賢明かどうかはよくわかりません。これにより、モデルのパフォーマンスが向上しますか?
どの変数が自分のモデルにとってより重要であるかを知りたいのですが、PCA を使用すると、どの PC がより重要であるかしかわかりません。
よろしくお願いします。
私は、約 4500 の変数を持つバイナリ クラスのランダム フォレストに取り組んでいます。これらの変数の多くは高度に相関しており、元の変数の分位数にすぎないものもあります。次元削減のために PCA を適用することが賢明かどうかはよくわかりません。これにより、モデルのパフォーマンスが向上しますか?
どの変数が自分のモデルにとってより重要であるかを知りたいのですが、PCA を使用すると、どの PC がより重要であるかしかわかりません。
よろしくお願いします。