0

DBSCANを実装しようとしていますが、その背後にある考え方がわかりません。データ全体を 1 つずつ調べて、近い隣人のために新しいクラスターを作成すると、常に多くのクラスターが得られます。最初のポイントの近くの隣人をチェックし、十分な数の隣人 (> MinPts) を見つけ、それらのクラスターを作成し、次のポイントに移動し、隣人をチェックし (既にクラスター内にある隣人を見つけることもあります)、それらの新しいクラスターを作成するとします。 . 等々。したがって、いくつかのポイントが複数のクラスターに追加されます...したがって、多くのクラスターが作成されます。

誰かがこのアルゴリズムがどのように機能するか説明できますか? 私はそれについてオンラインで多くの情報を見つけませんでした。

4

2 に答える 2

0

Web 上には DBSCAN に関する資料がたくさんあります... ウィキペディアを調べても、詳細なアルゴリズムを見つけることができます。

http://en.wikipedia.org/wiki/DBSCAN#アルゴリズム

それをコーディングするためにどの言語を使用していますか? matlab、java、または r に精通している場合は、オンラインで多くの実装があり、役立つかもしれません...

開始するのに適した情報源は、元の論文です...

于 2014-05-22T21:12:13.483 に答える
0

いいえ、クラスターを作成したら、クラスター内のポイントを見て、それらのいずれかが独自のクラスターを持つのに十分な密度を持っている場合、その「プロトクラスター」内のすべてのポイントが元のクラスターに追加されます。このようにして、プロセスを続行するのに十分な隣接ポイントがないポイントが追加されるように密度が減少するまで、凝集を続けます。これが完了すると、そのクラスター内のすべてのポイントが市場で「クローズ」され、残りの「オープン」ノードで新しいクラスターを探すプロセスが再開されます。

于 2014-05-22T15:16:22.170 に答える