Naive Bayes モデルを使用して、ドキュメントをポジティブ ラベルとネガティブ ラベルとして分類しています。72 ドキュメント前後の小さなバランスの取れたデータセット サイズでは問題なく動作しているようです。しかし、否定的なラベルの付いたドキュメントをさらに追加すると、分類子はすべてを否定的に予測しています。
データセットを 80% のトレーニング セットと 20% のテスト セットに分割しています。否定的にラベル付けされたドキュメントを追加すると、データセットが確実に歪められます。分類子がすべてのテスト ドキュメントをネガティブと予測するのは、歪度のせいでしょうか? Navive Bayes modle の TextBlob/nltk 実装を使用しています。
何か案が?