5

トレーニング済みの機械学習モデルを永続化して再利用するための提案/ベスト プラクティスはありますか? Python または R でモデルを開発しています。次に、これらのモデルを生産ワークフローでスコアリングのために使用する必要があります (R が使用できない場合)。たとえば、R でトレーニングされたロジスティック回帰モデルがあるとします。このモデルに対して新しい観測値をスコアリングする必要があります。スコアリング エンジンは高速でスケーラブルでなければなりません。フォローしようと思った

  1. PMML ( http://en.wikipedia.org/wiki/Predictive_Model_Markup_Language )。R で開発されたほとんどのモデルを pmml に変換するのは簡単です。しかし、PMML モデルに役立つスコアリング エンジンは見つかりませんでした。たとえば、augustus ( https://code.google.com/p/augustus/ ) がありますが、まだ 3 ~ 4 つのモデルしか実装していません。

  2. Python で pickle を使用してモデルをシリアル化し、Python でコンシューマーを記述します。

正しいアプローチに関する考えや提案はありますか?

4

3 に答える 3

0

You may use messagepack. It uses JSON like format to store the model. It's fast and takes less memory. https://github.com/muayyad-alsadi/sklearn_msgpack

于 2020-05-17T13:28:34.793 に答える