これらの 2 つのリンクを参照して mahout NB 分類子を実行しました
[1] http://tharindu-rusira.blogspot.com/2014/01/naive-bayes-classification-apache-mahout.html
[2] http://chimpler.wordpress.com/2013/03/13/using -the-mahout-naive-bayes-classifier-to-automatically-classify-twitter-messages/
mahout でデータをトレーニング セットとテスト セットに分割する代わりに、独自のテスト セットを使用したいと考えています (80:20)。どうすればそれを達成できますか?