私はmahout分類子をトレーニングしています。ステミング、小文字化、およびトレーニングデータのストップワード削除を行う必要がありますか、それともmahoutがトレーニングプロセスの一部としてこれを処理します。以下のコマンドは、トレーニングに使用しています。
$MAHOUT_HOME/bin/mahout trainclassifier -i category-training-data -o category-bayes-model -type bayes -ng 1 -source hdfs