カテゴリ データをクラスタリングするための機械学習アルゴリズムの最も適切なファミリは何ですか? 次のデータセットがあるとします。
V1 V2 V3 V4
"v1a" "v2b" "v3b" "v4c"
"v1b" "v2f" "v3a" "v4c"
"v1a" "v2e" "v3b" "v4c"
どういうわけかそれらをクラスター化する方法はありますか? 私は Apache Mahout を通じてこれを行うことに特に関心があります。ヒント\アイデアは大歓迎です。