python - scikitのTfidfvectorizer出力に基づいて、上位100または1000の単語のバッグを選択する方法はありますか

翻译自：https://stackoverflow.com/questions/19604250 2013-10-26T07:40:18.290

313 次

3

Python の scikit-learn ライブラリのtfidfVectorizer出力に基づいて、上位 100/1000 の単語を見つけようとしています。scikit ライブラリの関数を使用してそれを行う方法はありますか?

手伝ってくれてありがとう

1 に答える 1

0

トップ 100/1000 ワードとはどういう意味ですか? データセットで最も頻繁に使用される単語は? これを行うには、Python 標準ライブラリのCounterクラスを使用できます。scikit-learn は必要ありません。

于 2013-10-26T13:23:50.840 に答える