2080 次
1 に答える
15
サポート ベクター マシン (少なくとも scikit-learn がラッパーである libsvm に実装されている) は、基本的にバッチ アルゴリズムです。メモリ内のすべてのデータに一度にアクセスする必要があります。したがって、それらはスケーラブルではありません。
代わりに、このメソッドで増分学習をサポートするモデルを使用する必要がありますpartial_fit
。たとえば、 などの一部の線形モデルはこの方法をsklearn.linear_model.SGDClassifier
サポートしていpartial_fit
ます。データセットをスライスし、 shape を使用して一連のミニバッチとして読み込むことができます(batch_size, n_features)
。batch_size
1 にすることもできますが、Python インタープリターのオーバーヘッド (+ データ読み込みのオーバーヘッド) のため、効率的ではありません。そのため、少なくとも 100 のミニタッチでサンプルをリードすることをお勧めします。
于 2013-04-21T08:15:05.630 に答える