weka - StringToWordVector を使用していくつかの単語をブーストすることは可能です

Question

StringToWordVector Naive Bayes と StringToWordVector を使用してテキストを分類しています。また、単語にスコアを付けるために TD/IDF を使用しています。

特定のクラスのモデルでこの単語の重みを増やすために、トレーニング中にいくつかの単語 (自分で選択した) のスコアを上げる簡単な方法はありますか? したがって、この単語が新しいドキュメントに存在する場合、分類子は、ドキュメントがこのクラスに属している可能性が高いことを認識します。

ありがとう！

score 0 · Accepted Answer

特定の単語を含むドキュメントが特定の種類のドキュメントとして分類される確率を高めたいと考えています。

できることは、これらの単語を正確に含む「手作りの」ドキュメントで分類器をトレーニングし、これらのドキュメントを特定のクラスに属するものとしてマークすることです。

1 に答える 1