SGDClassifier()
マルチラベル分類をサポートしていると信じてloss='log'
おり、OneVsRestClassifier を使用する必要はありません。これをチェックして
現在、私のデータセットは非常に大きく、HashingVectorizer
結果を入力として使用して渡していますSGDClassifier
。私のターゲットには 42048 個の機能があります。
これを実行すると、次のようになります。
clf.partial_fit(X_train_batch, y)
私は得る: ValueError: bad input shape (300000, 42048)
.
次のようにクラスもパラメーターとして使用しましたが、それでも同じ問題があります。
clf.partial_fit(X_train_batch, y, classes=np.arange(42048))
SGDClassifier のドキュメントには、次のように書かれていますy : numpy array of shape [n_samples]