問題タブ [tfidfvectorizer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - 異なる単語に対して同じ tfidf 値を取得する
だから私は、収集したツイートに TFIDF を使用する必要がある twitter 感情分析に関するプロジェクトを行っています。そこで、つぶやきのリストを単一の文字列に変換し、それをオブジェクトに与えました。問題は、いくつかの異なる値を持つほとんどの単語に対して同じ値を取得していることですが、それらも非常に頻繁に発生することです。なぜこうなった ?入力として単一の文字列を使用しているのが原因ですか?
ここにコードがありますhttps://trinket.io/python/9c2daed912
python-3.x - TfidfVectorizer.fit_transform() 内でユーザー定義関数を渡す方法
次のようにストップワードを単純に削除するテキスト前処理の機能があります。
私が本質的に行った機能マトリックスを提供text_preprocessing()
する別の関数に渡したい:-tf_idf()
次のようなエラーが発生しましたTypeError: 'function' object is not iterable