正のラベルが非常に少ない非常に不均衡なデータがあります。データは非常に高次元です。その上、私の機能も非常にまばらです。
この場合、機能選択を行う最良の方法は何でしょうか。spearmann や pearson の相関関係に基づく相関尺度ランクは、適切なものではありません。私のラベルと機能のほとんどはゼロであり、それほど重要ではありませんが、この機能は非常に相関しているように見えるかもしれません。
何か提案はありますか?
正のラベルが非常に少ない非常に不均衡なデータがあります。データは非常に高次元です。その上、私の機能も非常にまばらです。
この場合、機能選択を行う最良の方法は何でしょうか。spearmann や pearson の相関関係に基づく相関尺度ランクは、適切なものではありません。私のラベルと機能のほとんどはゼロであり、それほど重要ではありませんが、この機能は非常に相関しているように見えるかもしれません。
何か提案はありますか?