3

大量のデータがあり、データを分割し、複数のスレッドまたは複数のマシンで実行されている複数の推定器を適合させることにより、推定器の適合を並列化したいと考えています。

一部の推定器は、コア外学習用の partial_fit API を提供します (例:PassiveAggressiveClassifier ここ)

複数の推定量を部分的に適合させてから、個々の適合を単一の推定量に結合することは可能ですか?

4

1 に答える 1

1

標準 API を使用しない。coef_andを平均するだけでintercept_、意味のある推定量が得られます。1 つのコアで並列化しますか、それともネットワークで並列化しますか? より効率的なオプションがあるかもしれませんが、そのほとんどはもう少し作業が必要です。SGD の並列実装がありますが、これらはおそらく巨大なデータ セットに対してのみ支払うことになります。データのサイズ (サンプル数、特徴数、スパース性) は?

于 2015-04-09T20:47:50.020 に答える