次の 4 つのセットがあるとします。
s1={1,2,3,4};
s2={2,3,4};
s3={2,3,4,5};
s4={1,3,4,5};
この 4 セットのグループの類似度を表す標準的なメトリックはありますか?
ジャカード方式のご提案ありがとうございます。ただし、ペアワイズのようです。セットのグループ全体の類似度を計算するにはどうすればよいですか?
次の 4 つのセットがあるとします。
s1={1,2,3,4};
s2={2,3,4};
s3={2,3,4,5};
s4={1,3,4,5};
この 4 セットのグループの類似度を表す標準的なメトリックはありますか?
ジャカード方式のご提案ありがとうございます。ただし、ペアワイズのようです。セットのグループ全体の類似度を計算するにはどうすればよいですか?
ペアごとに、2 つのセットのJaccard 距離を計算できます。{1, 2, 3…} がすべて単位ベクトルである空間内のブール値のベクトルである場合、それは単純に 2 つのセット間の距離です。
東武が言ったように、集合の和で割った交差点であるJaccard インデックスを使用します。
あなたの質問はあまり具体的ではありません。しかし、それらの間の「編集距離」のようなものを意味していると思いますか?つまり、s2 に到達するために s1 をどのくらい変更する必要がありますか?
Edit distanceに関するウィキペディアの記事を確認してください。
各セット間の交点のサイズを計算できます