2

30.000 テキストのデータ セットで KernelPCA を実行しようとすると、メモリ エラーが発生します。RandomizedPCA は問題なく動作します。何が起きているかというと、RandomizedPCA はスパース配列で機能し、KernelPCA は機能しないということです。

scikits-learn でスパース配列サポートを使用して現在実装されている学習方法のリストを持っている人はいますか?

4

1 に答える 1

1

私たちはまだそれを持っていません。今のところ、個々のクラスのドキュメント文字列を読む必要があります。

いずれにせよ、非線形モデルは、テキスト ドキュメントなどの非常に薄暗いスパース データの場合、線形モデルよりもうまく機能する傾向はありません (そして、より簡単にオーバーフィットする可能性があります)。

于 2012-04-25T02:45:09.740 に答える