similarity - セットの類似性 (セットのサイズも考慮)

翻译自：https://stackoverflow.com/questions/13855224 2012-12-13T07:44:12.833

1003 次

Jaccard index \ distance を使用して、2 つのセットの類似度 / 距離を測定できることを知っています。ただし、セットの長さに関して生の Jaccard 値をスケーリングする方法を探しています。たとえば、2 つの小さなセットよりも大きな重複がある 2 つの大きなセットの類似性を高くしたいと考えています。

もちろん、単純に Jaccard 距離の値を両方のセットの和集合のサイズで割ることもできますが、その目的のためのスケーリングの標準的なスキームはありますか?

similarity - セットの類似性 (セットのサイズも考慮)

0 に答える 0

Related

Reference