Apche Spark Mllib Logistic Regression および Linear Regression アルゴリズムを使用しています。ドキュメントに記載されているコード スニペットを使用しています。最新バージョンの Spark 1.5 で LogisticRegressionWithSGD と LinearRegression を使用しているときに発生する問題。
LogisticRegressionwithSGDに使用したパラメーター値は次のとおりです。
Stepsize=0.01
反復回数 = 1000
minBatchFraction = 0.001
この値の混同行列は
27821 0
2287 0
LogisticRegressionWithLBFGSを使用した同じデータの場合、混同行列は次のようになります。
27541 280
1249 1038
LogisticRegressionWithSGDの結果については完全に無知です。LogisticRegressionWithSGDで適切な結果が得られない理由を教えてください。