0

私はmahout分類子をトレーニングしています。ステミング、小文字化、およびトレーニングデータのストップワード削除を行う必要がありますか、それともmahoutがトレーニングプロセスの一部としてこれを処理します。以下のコマンドは、トレーニングに使用しています。

$MAHOUT_HOME/bin/mahout trainclassifier -i category-training-data -o category-bayes-model -type bayes -ng 1 -source hdfs
4

1 に答える 1

1

そのような前処理は行いません。

于 2013-03-21T10:01:39.650 に答える