0

20,000 を超える機能、300 万を超えるオブジェクト、および 3,000 を超えるクラスでテキスト分類の問題が発生しています。データは非常にまばらです。私は R でプログラムを書きました。sparseMatrix オブジェクトのデータ マトリックス。このデータの特徴を選択するにはどうすればよいですか? パッケージ FSelector を見つけましたが、sparseMatrix では動作せず、data.frame のみで動作し、メモリの制限によりデータを変換できません。

4

1 に答える 1

0

以下をご覧ください。

Fセレクター:

https://cran.r-project.org/web/packages/FSelector/FSelector.pdf

varSelRF:

https://cran.r-project.org/web/packages/varSelRF/varSelRF.pdf

R、相関行列フィルター、PCA & 後方選択:

http://www.r-bloggers.com/introduction-to-feature-selection-for-bioinformaticians-using-r-correlation-matrix-filters-pca-backward-selection/

于 2016-06-22T13:17:36.910 に答える