Pipeline 抽象化を使用して Spark 1.6 で GBTClassifier をトレーニングしましたが、それを保存する方法について少し混乱しています。
私が行った場合:
GBTClassificationModel gbt = trainClassifierGBT(data);
Model Accuracy = 0.8306451612903226
Test Error = 0.16935483870967738
GradientBoostedTreesModel oldGBT = gbt.toOld();
oldGBT.save(jsc.sc(), "data/gbtModel");
私は得る:
java.lang.NullPointerException
私が行った場合:
PipelineModel pipeModel = pipeline.fit(training);
pipeline.save("data/gbtModel");
私は得る:
Exception in thread "main" java.lang.UnsupportedOperationException: Pipeline write will fail on this Pipeline because it contains a stage which does not implement Writable.
この解決策をテストしますが、別の方法で解決できるかどうか疑問に思います。 Spark ML パイプライン API の保存が機能しない