0

重複の可能性:
同様の URL のグループ化に DBSCAN アルゴリズムを適用する方法

プロジェクトはDBSCANを使用して同様の文字列をクラスタリングすることに関係しているため、最終的なsemでプロジェクトを実行するように言われました。DBSCAN を使用してこれを実行できるかどうかを知りたいです。そうであれば、どうすれば同じことを実装できますか。

4

1 に答える 1

1

前に ( How to apply DBSCAN algorithm on grouping of similar url で) 説明したように、これは可能です。

ただし、アプリケーションに必要な類似性を定義する必要があります。

どのような種類の類似性が必要なのかが非常に明確でない限り、stackoverflow の誰もあなたを助けることができません。

多くの文字列メトリックが利用可能であり特定の問題に対して何が機能するかを見つける必要があります。

https://en.wikipedia.org/wiki/String_metric

于 2012-09-16T11:11:27.957 に答える