python - scikit svm を 1 つずつトレーニングします (オンラインまたは確率的トレーニング)

翻译自：https://stackoverflow.com/questions/16128834 2013-04-21T07:15:58.510

2080 次

1 に答える 1

サポートベクターマシン (少なくとも scikit-learn がラッパーである libsvm に実装されている) は、基本的にバッチアルゴリズムです。メモリ内のすべてのデータに一度にアクセスする必要があります。したがって、それらはスケーラブルではありません。

代わりに、このメソッドで増分学習をサポートするモデルを使用する必要がありますpartial_fit。たとえば、などの一部の線形モデルはこの方法をsklearn.linear_model.SGDClassifierサポートしていpartial_fitます。データセットをスライスし、 shape を使用して一連のミニバッチとして読み込むことができます(batch_size, n_features)。batch_size1 にすることもできますが、Python インタープリターのオーバーヘッド (+ データ読み込みのオーバーヘッド) のため、効率的ではありません。そのため、少なくとも 100 のミニタッチでサンプルをリードすることをお勧めします。

于 2013-04-21T08:15:05.630 に答える

python - scikit svm を 1 つずつトレーニングします (オンラインまたは確率的トレーニング)

1 に答える 1

Related

Reference