python - バイナリデータのクラスタリング

翻译自：https://stackoverflow.com/questions/17897624 2013-07-27T12:07:32.057

2591 次

次のデータ (サンプル) に対してクラスター分析を実行します。

    ID     CODE1     CODE2     CODE3     CODE4      CODE5      CODE6
   ------------------------------------------------------------------
   00001     0         1         1         0          0          0
   00002     1         0         0         0          1          1
   00003     0         1         0         1          1          1
   00004     1         1         1         0          1          0
    ...

1 はその人物のコードの存在を示し、0 は不在を示します。この種のデータ (約 100 万の異なる ID) のコードをクラスタリングするのに最も適しているのは k 平均法または階層的クラスタリングですか? ? これらの方法のどちらも適切でない場合、どの方法が最も適切だと思いますか?

ありがとうございました

python - バイナリ データのクラスタリング

1 に答える 1

Related

Reference

python - バイナリデータのクラスタリング