3

感情分析のために単純ベイズ分類器を実装しようとしています。TF-IDF 重み付けメジャーを使用する予定です。私は今ちょっと立ち往生しています。NB は通常、単語 (機能) の頻度を使用して最尤法を見つけます。では、ナイーブ ベイズに TF-IDF 重み付け測定を導入するにはどうすればよいでしょうか。

4

1 に答える 1

2

TF-IDF 重みを統計モデルの特徴/予測子として使用します。gensim [1] または scikit-learn [2] を使用して重みを計算し、それを Naive Bayes フィッティング手順に渡すことをお勧めします。

scikit-learn 'working with text' チュートリアル [3] も興味深いかもしれません。

[1] http://scikit-learn.org/dev/modules/generated/sklearn.feature_extraction.text.TfidfTransformer.html

[2] http://radimrehurek.com/gensim/models/tfidfmodel.html

[3] http://scikit-learn.github.io/scikit-learn-tutorial/working_with_text_data.html

于 2013-04-18T08:22:24.080 に答える