5 から 6 の異なるソースからの数千から 1 万のデータ ポイント (x,y) があります。形成されたグループに各ソースからの入力が 1 つだけ含まれ、グループ内の各入力が特定の距離 d 内に収まるように、特定の距離基準に基づいてそれらを一意にグループ化する必要があります。形成されたグループは、可能な限り最適に一致する必要があります。
- これはクラスタリングと最近傍の組み合わせですか?
- アルゴリズムの推奨事項は何ですか?
- 利用可能なオープンソースはありますか?
KD ツリーの実装や k-clustering などの参考文献がたくさんあります。この特定のニーズに合わせてどのように調整すればよいかわかりません。