感情から抽出したポジティブ/ネガティブな単語を使用して、単純ベイズ分類器をトレーニングしようとしています。例:
私はこの映画が大好きです:))
雨が降ると嫌いです:(
アイデアは、使用された感情に基づいて肯定的または否定的な文を抽出することですが、分類子をトレーニングしてデータベースに永続化するためです。
問題は、そのような文が100万を超えることです。したがって、単語ごとにトレーニングすると、データベースはトスになります。関連性のない単語の例「I」、「this」、「when」、「it」をすべて削除して、データベースクエリを実行する回数を減らしたいと思います。
この問題を解決するのを手伝って、より良い方法を提案してください
ありがとうございました