4

SGDClassifier()マルチラベル分類をサポートしていると信じてloss='log'おり、OneVsRestClassifier を使用する必要はありません。これをチェックして

現在、私のデータセットは非常に大きく、HashingVectorizer結果を入力として使用して渡していますSGDClassifier。私のターゲットには 42048 個の機能があります。

これを実行すると、次のようになります。

clf.partial_fit(X_train_batch, y)

私は得る: ValueError: bad input shape (300000, 42048).

次のようにクラスもパラメーターとして使用しましたが、それでも同じ問題があります。

clf.partial_fit(X_train_batch, y, classes=np.arange(42048))

SGDClassifier のドキュメントには、次のように書かれていますy : numpy array of shape [n_samples]

4

1 に答える 1