4

バイナリ ベクトル (数百万個) を k 個のクラスターにクラスター化したいと考えています。ハミング距離を使用して、初期クラスターの最近傍を見つけています (これも非常に低速です)。K-means クラスタリングはここには当てはまらないと思います。問題は、重心を更新するために、いくつかの初期クラスター中心に最も近い近傍 (バイナリ ベクトル) の平均を計算することです。

2 番目のオプションは、新しいクラスター中心が最近傍の 1 つ (特定のクラスター中心のすべての近傍に最も近いもの) から選択される K-medoid を使用することです。しかし、最近傍の数も非常に多いため、それを見つけることは別の問題です。

誰かが私を案内してもらえますか?

4

2 に答える 2