問題タブ [tfidfvectorizer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
538 参照

python - TfidfTransformer 入力と TfidfTransformer() として機能する CountVectorizer 出力

最近、私は NLP についてもっと読み始め、このテーマについてもっと学ぶために Python のチュートリアルに従っています。チュートリアルの 1 つに従っているときに、データを処理し、トレーニングと予測のために分類子にフィードする TfidfTransformer への入力として、各ツイート (CountVectorizer で作成) の単語数のスパース マトリックスを使用していることに気付きました。

説明がなかったので、この思考プロセスが理解できません... 普通の Bag of Words じゃないですか?これは、関数の 1 つだけ、たとえば Tfidf だけを使用して行うことはできませんか?

明確化をいただければ幸いです。