ユークリッド距離の理解に問題があります。2 つの異なるエンティティがあり、これらのエンティティ間の類似性を測定したいと考えています。
エンティティ A には 2 つの特徴ベクトルがあり、エンティティ B には 1 つの特徴ベクトルしかないとします。類似性を知るために、これら 2 つのエンティティ間のユークリッド距離を計算するにはどうすればよいですか?
どうもありがとう。
ユークリッド距離の理解に問題があります。2 つの異なるエンティティがあり、これらのエンティティ間の類似性を測定したいと考えています。
エンティティ A には 2 つの特徴ベクトルがあり、エンティティ B には 1 つの特徴ベクトルしかないとします。類似性を知るために、これら 2 つのエンティティ間のユークリッド距離を計算するにはどうすればよいですか?
どうもありがとう。
これは悪い質問ではありません。
数学者は、要素の2つのセット(AとB)間のユークリッド距離を、いずれかのセットの要素の任意の2つのペア間の最小距離として定義する場合があります。
これら2つのセットの最大値を使用することもできます。それはハウスドルフ距離と呼ばれます。
つまり、セットAの各要素からセットBの各要素までのユークリッド距離を計算し、2つのセット間の距離d(A、B)を任意の最小(または最大)距離として定義できます。計算した要素のペア。
ハウスドルフ(最大)距離には、より優れた数学的特性があり、空でないコンパクトセット(要素は離散的であるため要素になります)の空間では、次の条件を満たすという点で適切な数学的距離になります。
空でないすべてのコンパクトセットA、B、Cの場合
同じ次元のベクトルに対してのみユークリッド距離を計算できます。ただし、エンティティ 2 で欠落している機能のデフォルト値をいくつか定義できます。
L2 は 2 つの特徴ベクトルの間にあります。これらの 2 つは、それを行うための自然な方法です。
エンティティ 1 のすべての特徴ベクトルとエンティティ 2 のすべての特徴ベクトルの間の最小 L2 距離を見つけることができます。エンティティ 1 に A=[1,3,2,1] と B=[3 のような 2 つのベクトルがある場合、 2,4,1] C=[1,2,4,2] のようなエンティティ 2 の AND 1 ベクトル。次に、dist = min(d([1,3,2,1],[1,2,4,2]),d([3,2,4,1],[1,2,4,2])
エンティティ 1 のすべてのベクトルとエンティティ 2 の平均ベクトルの間の平均ベクトルを見つけることができます。次に、L2 距離を計算します。A=[1,3,2,1] および B=[3,2,4,1] のようなエンティティ 1 の 2 つのベクトルと、C=[1,2,4,2] のようなエンティティ 2 の 1 つのベクトルがある場合. 次に、dist = d([(1+3)/2,(3+2)/2,(2+4)/2,(1+1)/2],[1,2,4,2])