4

Rツリーを使用してDBSCANを実装しようとしています.Rツリーの形式でデータを保存できます.だから私の質問は、Rツリーにリアルタイムデータを保存する方法と、それを使用してポイントの近傍を見つけるための領域クエリをどのように実装する必要があるかです. ?

4

2 に答える 2

2

最初に R ツリーを実装し、次に DBSCAN を実装します。

リアルタイムに関しては、おそらくデータ ストリーム用の特殊なクラスタリング アルゴリズムを調べる必要があります。

于 2011-11-25T17:43:26.787 に答える
0

リアルタイムデータの意味がわかりません。データの変更やデータのストリームを参照する場合は、Rツリーから古いものを削除することもできます。データにも時間次元があるということは、Rツリーが管理する係数の数を(x、y、t)に単純に拡張できるということです。単純な2変量バージョンを使用していると思います。

DBSCANを実装する場合は、ポイント周辺の球面領域の密度を計算するために範囲クエリを実行する必要があります。したがって、リージョンクエリは球形のクエリリージョンを処理できる必要があります(さらに言えば、佐藤真一によるSRツリーも確認することをお勧めします)。繰り返しになりますが、リアルタイムデータとは、データに時間的特徴があることを意味する場合、楕円体のクエリ領域の使用を検討することをお勧めします(空間的特徴と時間的特徴を別々にスケーリングできます)。

お役に立てば幸いです:]

于 2011-10-03T16:06:58.847 に答える