1

特徴選択に Scikit を使用していますが、テキスト内のすべてのユニグラムのスコア値を取得したいと考えています。スコアを取得しましたが、これらを実際の機能名にマップするにはどうすればよいですか。

from sklearn.feature_extraction.text  import CountVectorizer
from sklearn.feature_selection import  SelectKBest, chi2

Texts=["should schools have uniform","schools discipline","legalize marriage","marriage culture"]
labels=["3","3","7","7"]
vectorizer = CountVectorizer()
term_doc=vectorizer.fit_transform(Texts)
ch2 = SelectKBest(chi2, "all")
X_train = ch2.fit_transform(term_doc, labels)
print ch2.scores_

これで結果が得られますが、どの機能名がどのスコアにマップされているかを知るにはどうすればよいでしょうか?

4

1 に答える 1