私は次のようなトレーニングデータセットを持っています:
0.00479616 | 0.0119904 | 0.00483092 | 0.0120773 | 1
0.51213136 | 0.0113404 | 0.02383092 | -0.012073 | 0
0.10479096 | -0.011704 | -0.0453692 | 0.0350773 | 0
最初の 4 列は 1 つのサンプルの特徴で、最後の列はその出力です。
私はこのようにscikitを使用します:
data = np.array(data)
lr = linear_model.LogisticRegression(C=10)
X = data[:,:-1]
Y = data[:,-1]
lr.fit(X, Y)
print lr
# The output is always 1 or 0, not a probability number.
print lr.predict(data[0][:-1])
ロジスティック回帰は常に 0 から 1 の間の確率値を与えるべきだと思いました。