python - 機械学習モデルの永続化オプション

Question

トレーニング済みの機械学習モデルを永続化して再利用するための提案/ベストプラクティスはありますか? Python または R でモデルを開発しています。次に、これらのモデルを生産ワークフローでスコアリングのために使用する必要があります (R が使用できない場合)。たとえば、R でトレーニングされたロジスティック回帰モデルがあるとします。このモデルに対して新しい観測値をスコアリングする必要があります。スコアリングエンジンは高速でスケーラブルでなければなりません。フォローしようと思った

PMML ( http://en.wikipedia.org/wiki/Predictive_Model_Markup_Language )。R で開発されたほとんどのモデルを pmml に変換するのは簡単です。しかし、PMML モデルに役立つスコアリングエンジンは見つかりませんでした。たとえば、augustus ( https://code.google.com/p/augustus/ ) がありますが、まだ 3 ～ 4 つのモデルしか実装していません。
Python で pickle を使用してモデルをシリアル化し、Python でコンシューマーを記述します。

正しいアプローチに関する考えや提案はありますか?

score 0 · Accepted Answer

You may use messagepack. It uses JSON like format to store the model. It's fast and takes less memory. https://github.com/muayyad-alsadi/sklearn_msgpack

python - 機械学習モデルの永続化オプション

3 に答える 3

Related

Reference