Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
Weka を使用して一連のテキスト ドキュメントのクラスタリングを実行しました。同様のドキュメントをクラスタにグループ化しました。クラスタ内でテキスト ドキュメントが互いにどの程度接近しているかを測定したいです。クラスタ内のドキュメント間の距離を計算する方法。
誰でも私を助けてください。私はデータマイニングの初心者です。
これは、simpleKmeans クラスタリング アルゴリズムのコードです。
EuclideanDistance Dist = weka.core.EuclideanDistance(); Double distance = Dist.distance(clusterCentroid.instance(clusterNumber), Data.instance(instaceIndex));
注意: この距離は正規化されています