私は約 150 のカテゴリ (おそらく Java) を持つ分類子を主にツイート (非常に小さなドキュメント) 用に実装しようとしています。「企業」、「競争」、「消費者」、「国際法」、「国際機関」、「国際政治と政府」。このような高解像度が必要な場合、どのアルゴリズム/アプローチが最適ですか? Naive Bayes (obv) を試しましたが、これまでのところあまりうまく機能していません (ただし、トレーニング データの品質が原因である可能性があります)。コミュニティの考えは大歓迎です!
ありがとう、
マーク