-3

DBSCAN アルゴリズムを使用して類似の URL をグループ化する方法。私は多くのデータセットを見てきましたが、どれも url にありませんでした。同様のタイプの URL を取得してグループ化したいと考えています。ここでは、距離 (eps) を知ることができず、minpoints はグループ化する URL の数にすることができます。

4

1 に答える 1

3

DBSCANには、類似したオブジェクトを検出するための距離関数としきい値が必要です。

したがって、先に進むには、最初に適切な距離関数としきい値を定義する必要があります。次に、DBSCANを支援します(ただし、任意の距離関数に拡張できるDBSCAN実装を見つけることができるはずです)。

重要な課題は距離です。これはあなた次第です。あなたが何をしたいのかわからないからです。これは非常に主観的なものであり、私たちはあなたが何を望んでいるか、何が必要かを知りません。

于 2012-09-14T10:34:08.913 に答える