コマンドラインで次のコマンドを使用して、Mahout kmeans アルゴリズムを使用してデータをクラスター化します
mahout kmeans -i /vect_out/tfidf-vectors/ -c /out_canopy -o /out_kmeans -dm
org.apache.mahout.common.distance.SquaredEuclideanDistanceMeasure -cd 1.0 -x 20 -cl
/out_canopy は、Mahout canopy クラスタリングを使用して作成されたクラスターを含むディレクトリです。このディレクトリには、名前付きのディレクトリと名前付きのファイルclusters-0
が含まれるディレクトリが含まれます。_logs
part-r-00000
しかし、それは次のエラーを報告し続けます
java.lang.IllegalStateException: No clusters found. Check your -c path.
at org.apache.mahout.clustering.kmeans.KMeansMapper.setup