1

scikit-learn Web サイト http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.htmlで、この例のさまざまな分類子を調べようとしています。ただし、次のコードではエラーが発生しました: ValueError: 配列要素にシーケンスを設定しています。

from sklearn.feature_extraction.text import CountVectorizer
from sklearn.feature_extraction.text import TfidfTransformer
import tensorflow.contrib.learn as skflow

data = ["I so handsome. I just broke the mirror!","I am a normal guy."]
label = np.array([0,1])

#CountVectoriser
count_vect = CountVectorizer()
X_train_counts = count_vect.fit_transform(data)

#TfidfTransformer
tfidf_transformer = TfidfTransformer()
X_train_tfidf = tfidf_transformer.fit_transform(X_train_counts)

#Classifier
clf = skflow.TensorFlowLinearClassifier(n_classes=2)
clf.fit(X_train_tfidf, label)
4

1 に答える 1

2

TensorFlowLinearClassifierCSR マトリックスを入力として処理しません。その問題の進行状況を追跡できます。


今のところできることは、X_train_tfidfに供給する前に numpy マトリックスに変換することですclf.fit():

clf.fit(X_train_tfidf.toarray(), label)
于 2016-06-28T08:47:35.570 に答える