DBSCAN アルゴリズムを実装する必要があります。この疑似コードから開始すると仮定します
DBSCAN(D, eps, MinPts)
C = 0
for each unvisited point P in dataset D
mark P as visited
NeighborPts = regionQuery(P, eps)
if sizeof(NeighborPts) < MinPts
mark P as NOISE
else
C = next cluster
expandCluster(P, NeighborPts, C, eps, MinPts)
expandCluster(P, NeighborPts, C, eps, MinPts)
add P to cluster C
for each point P' in NeighborPts
if P' is not visited
mark P' as visited
NeighborPts' = regionQuery(P', eps)
if sizeof(NeighborPts') >= MinPts
NeighborPts = NeighborPts joined with NeighborPts'
if P' is not yet member of any cluster
add P' to cluster C
regionQuery(P, eps)
return all points within P's eps-neighborhood
私のコードは、Ubuntu Linux 64 ビットのAmazon EC2インスタンスで実行する必要があります。
関数regionQueryは、 MongoDBデータベースにクエリを実行して、P の eps 近傍内のすべてのポイントを取得します。
それで、あなたによると、パフォーマンスを向上させるために実装するのに最適なプログラミング言語は何ですか? C、PHP、Java (とは思いません)?