Python と scikit-learn を使用して、onehotencoding プロセスの出力を理解しようとしています。1 つのホット エンコーディングのアイデアが得られると思います。つまり、離散値を「on」の値を持つ拡張特徴ベクトルに変換して、分類のメンバーシップを識別します。おそらく私はそれを間違えたので、混乱していますが、それが私の理解です。
したがって、ここのドキュメントから: http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html
次の例が表示されます。
>>> from sklearn.preprocessing import OneHotEncoder
>>> enc = OneHotEncoder()
>>> enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
OneHotEncoder(categorical_features='all', dtype=<... 'numpy.float64'>,
handle_unknown='error', n_values='auto', sparse=True)
>>> enc.n_values_
array([2, 3, 4])
>>> enc.feature_indices_
array([0, 2, 5, 9])
>>> enc.transform([[0, 1, 1]]).toarray()
array([[ 1., 0., 0., 1., 0., 0., 1., 0., 0.]])
[[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]] が [[ 1., 0., 0., 1., 0., 0., 1., 0., 0.]]?
変換引数 [0, 1, 1] はどのように使用されますか?
これについて何か助けてくれてありがとう
ジョン