SVMで解決しているバイナリ分類の問題があります。クラスはトレーニング データで不均衡です。バイナリ スコアだけでなく、事後確率の出力を取得する必要があります。Weka の SMO と LibSVM のいずれかで Platt スケーリングを使用しようとしました。これらの実装の両方で、少数派クラスの f1 測定に関して、バイナリ結果のみを生成した場合よりも悪い結果が得られます。
SVM バイナリ結果を次のルールを維持する確率に変換する方法を知っていますか: 「決定値 >= 0 の場合に限り確率 > = 0.5」。
つまり、各サンプルが取得するラベルは、バイナリ分類または確率のいずれを使用しても同じです。