python - python、scikits-learn:スパース特徴ベクトルをサポートする学習方法はどれですか?

Question

30.000 テキストのデータセットで KernelPCA を実行しようとすると、メモリエラーが発生します。RandomizedPCA は問題なく動作します。何が起きているかというと、RandomizedPCA はスパース配列で機能し、KernelPCA は機能しないということです。

scikits-learn でスパース配列サポートを使用して現在実装されている学習方法のリストを持っている人はいますか?

score 1 · Accepted Answer

私たちはまだそれを持っていません。今のところ、個々のクラスのドキュメント文字列を読む必要があります。

いずれにせよ、非線形モデルは、テキストドキュメントなどの非常に薄暗いスパースデータの場合、線形モデルよりもうまく機能する傾向はありません (そして、より簡単にオーバーフィットする可能性があります)。

1 に答える 1