0

正のラベルが非常に少ない非常に不均衡なデータがあります。データは非常に高次元です。その上、私の機能も非常にまばらです。

この場合、機能選択を行う最良の方法は何でしょうか。spearmann や pearson の相関関係に基づく相関尺度ランクは、適切なものではありません。私のラベルと機能のほとんどはゼロであり、それほど重要ではありませんが、この機能は非常に相関しているように見えるかもしれません。

何か提案はありますか?

4

1 に答える 1

0

SVM は、まばらなデータの分類に適しています。生成されたカーネル マトリックスを調べることで、他の機能よりも重要な機能を特定し、それらを機能の選択に使用できます。

于 2014-07-22T18:13:21.440 に答える