私は2D座標セットのコレクション(各セットに100K〜500Kポイントのスケールで)を持っており、1つのセットと他のセットの類似性を測定する最も効率的な方法を探しています。私はいつものことを知っています:Cosine、Jaccard / Tanimotoなど。しかし、類似性を測定するための高速で効率的なもの、特に類似性によってクラスター化できるものについての提案を期待しています。
編集1:画像は私がする必要があることを示しています。すべての赤、青、緑を形や向きなどでクラスター化する必要があります。