0

X10 個の機能のセットを持つオブジェクトがあるとします[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

次に、さらに 2 つのオブジェクトがあります。

  • A : [2, 2, 2, 2, 2, 2, 2, 2, 2, 2]
  • B : [0, 0, 0, 0, 0, 0, 0, 0, 0, 20]

Aどちらが から、またはBに「近い」かを知る必要がありXます。

「類似性」の背後にある考えは次のとおりです。

すべての機能がほぼ同じである方が、多くの機能が非常に似ていて一部が非常に異なるよりも優れています。

この「定義」によると、よりもAに近いようです。XB

ただし、算術平均は両方のオブジェクトで 2 であるため、このアイデアを実装するための適切なツールではないようです。

この種の問題に対する特定の指標はありますか?

4

3 に答える 3

1

コサイン類似度の使用を検討することもできます。コサイン類似度は原点に対するベクトルの類似度を測定し、ユークリッド距離はベクトルに沿った特定の対象点間の距離を測定します。

これは、どちらを選択するかについての素晴らしい記事です。

もう 1 つの一般的な尺度は、Jaccard の類似性です。 コサインとジャカードの類似性を比較した記事は次のとおりです

于 2015-10-18T22:26:50.023 に答える
1

ユークリッド距離はどうですか?

あなたの場合、A と X の間のユークリッド距離は 40 の平方根 (= 約 6.32) であり、B と X の間の距離は 20 であるため、A は実際にはそのメトリックにより類似しています。

于 2015-10-17T17:47:00.077 に答える
0

特徴が非常に類似しておらず、異なる可能性がある場合、ユークリッド距離を正規化する必要があります。

これは、特徴の分散を含むマハラノビス距離を使用して行うことができます。

マハラノビス距離

また、この質問を参照してください。

于 2015-10-17T18:39:09.643 に答える