6
4

1 に答える 1

15

サポート ベクター マシン (少なくとも scikit-learn がラッパーである libsvm に実装されている) は、基本的にバッチ アルゴリズムです。メモリ内のすべてのデータに一度にアクセスする必要があります。したがって、それらはスケーラブルではありません。

代わりに、このメソッドで増分学習をサポートするモデルを使用する必要がありますpartial_fit。たとえば、 などの一部の線形モデルはこの方法をsklearn.linear_model.SGDClassifierサポートしていpartial_fitます。データセットをスライスし、 shape を使用して一連のミニバッチとして読み込むことができます(batch_size, n_features)batch_size1 にすることもできますが、Python インタープリターのオーバーヘッド (+ データ読み込みのオーバーヘッド) のため、効率的ではありません。そのため、少なくとも 100 のミニタッチでサンプルをリードすることをお勧めします。

于 2013-04-21T08:15:05.630 に答える