Python の scikit-learn ライブラリのtfidfVectorizer出力に基づいて、上位 100/1000 の単語を見つけようとしています。scikit ライブラリの関数を使用してそれを行う方法はありますか?
手伝ってくれてありがとう
Python の scikit-learn ライブラリのtfidfVectorizer出力に基づいて、上位 100/1000 の単語を見つけようとしています。scikit ライブラリの関数を使用してそれを行う方法はありますか?
手伝ってくれてありがとう
トップ 100/1000 ワードとはどういう意味ですか? データセットで最も頻繁に使用される単語は? これを行うには、Python 標準ライブラリのCounterクラスを使用できます。scikit-learn は必要ありません。