5

次の 4 つのセットがあるとします。

s1={1,2,3,4};
s2={2,3,4};
s3={2,3,4,5};
s4={1,3,4,5};

この 4 セットのグループの類似度を表す標準的なメトリックはありますか?

ジャカード方式のご提案ありがとうございます。ただし、ペアワイズのようです。セットのグループ全体の類似度を計算するにはどうすればよいですか?

4

5 に答える 5

9

ペアごとに、2 つのセットのJaccard 距離を計算できます。{1, 2, 3…} がすべて単位ベクトルである空間内のブール値のベクトルである場合、それは単純に 2 つのセット間の距離です。

于 2010-01-09T23:15:55.287 に答える
2

東武が言ったように、集合の和で割った交差点であるJaccard インデックスを使用します。

于 2010-01-09T23:20:08.727 に答える
2

あなたの質問はあまり具体的ではありません。しかし、それらの間の「編集距離」のようなものを意味していると思いますか?つまり、s2 に到達するために s1 をどのくらい変更する必要がありますか?

Edit distanceに関するウィキペディアの記事を確認してください。

于 2010-01-09T23:14:03.153 に答える
0

それらの間のユークリッド距離を計算し、そこからデンドログラムを作成して類似性を視覚化できます。

于 2010-01-09T23:51:21.200 に答える
0

各セット間の交点のサイズを計算できます

于 2010-01-09T23:14:14.463 に答える