感情分析のために単純ベイズ分類器を実装しようとしています。TF-IDF 重み付けメジャーを使用する予定です。私は今ちょっと立ち往生しています。NB は通常、単語 (機能) の頻度を使用して最尤法を見つけます。では、ナイーブ ベイズに TF-IDF 重み付け測定を導入するにはどうすればよいでしょうか。
2683 次
1 に答える
2
TF-IDF 重みを統計モデルの特徴/予測子として使用します。gensim [1] または scikit-learn [2] を使用して重みを計算し、それを Naive Bayes フィッティング手順に渡すことをお勧めします。
scikit-learn 'working with text' チュートリアル [3] も興味深いかもしれません。
[1] http://scikit-learn.org/dev/modules/generated/sklearn.feature_extraction.text.TfidfTransformer.html
[2] http://radimrehurek.com/gensim/models/tfidfmodel.html
[3] http://scikit-learn.github.io/scikit-learn-tutorial/working_with_text_data.html
于 2013-04-18T08:22:24.080 に答える