python - scikitでカイ二乗特徴選択のスコアに対応する特徴名を取得する方法

質問する 2015-05-04T07:01:57.693

1789 次

特徴選択に Scikit を使用していますが、テキスト内のすべてのユニグラムのスコア値を取得したいと考えています。スコアを取得しましたが、これらを実際の機能名にマップするにはどうすればよいですか。

from sklearn.feature_extraction.text  import CountVectorizer
from sklearn.feature_selection import  SelectKBest, chi2

Texts=["should schools have uniform","schools discipline","legalize marriage","marriage culture"]
labels=["3","3","7","7"]
vectorizer = CountVectorizer()
term_doc=vectorizer.fit_transform(Texts)
ch2 = SelectKBest(chi2, "all")
X_train = ch2.fit_transform(term_doc, labels)
print ch2.scores_

これで結果が得られますが、どの機能名がどのスコアにマップされているかを知るにはどうすればよいでしょうか?

python - scikitでカイ二乗特徴選択のスコアに対応する特徴名を取得する方法

1 に答える 1

Related

Reference