Python( sklearn )で多変量線形回帰を実行していますが、何らかの理由で、係数がリストとして正しく返されません。代わりに、リスト内のリストが返されます。
from sklearn import linear_model
clf = linear_model.LinearRegression()
# clf.fit ([[0, 0, 0], [1, 1, 1], [2, 2, 2]], [0, 1, 2])
clf.fit([[394, 3878, 13, 4, 0, 0],[384, 10175, 14, 4, 0, 0]],[3,9])
print 'coef array',clf.coef_
print 'length', len(clf.coef_)
print 'getting value 0:', clf.coef_[0]
print 'getting value 1:', clf.coef_[1]
これにより、リスト[]ではなくリスト[[]]のリストの値が返されます。なぜこれが起こっているのか考えていますか?出力:
coef array [[ 1.03428648e-03 9.54477167e-04 1.45135995e-07 0.00000000e+00
0.00000000e+00 0.00000000e+00]]
length 1
getting value 0: [ 1.03428648e-03 9.54477167e-04 1.45135995e-07 0.0000000
0e+00 0.00000000e+00 0.00000000e+00]
getting value 1:
Traceback (most recent call last):
File "regress.py", line 8, in <module>
print 'getting value 1:', clf.coef_[1]
IndexError: index out of bounds
しかし、これは機能します:
from sklearn import linear_model
clf = linear_model.LinearRegression()
clf.fit ([[0, 0, 0], [1, 1, 1], [2, 2, 2]], [0, 1, 2])
# clf.fit([[394, 3878, 13, 4, 0, 0],[384, 10175, 14, 4, 0, 0]],[3,9])
print 'coef array',clf.coef_
print 'length', len(clf.coef_)
print 'getting value 0:', clf.coef_[0]
print 'getting value 1:', clf.coef_[1]
出力:
coef array [ 0.33333333 0.33333333 0.33333333]
length 3
getting value 0: 0.333333333333
getting value 1: 0.333333333333