次の 2 次元データセットがあります。両方 (X と Y) は連続確率変数です。
Z = (X, y) = {(1, 7), (2, 15), (3, 24), (4, 25), (5, 29), (6, 32), (7, 34) , (8, 35), (9, 27), (10, 39)}
y 変数の値に関して外れ値を検出したいと考えています。y 変数の通常の範囲は 10 ~ 35 です。したがって、上記のデータセットの最初と最後のペアは外れ値で、その他は通常のパリです。変数 z = (x, y) を、外れ値 (最初と最後のペア) が標準偏差 1 の外にある確率/頻度分布に変換したいと考えています。
PS: ユークリッド距離やマハラノビス距離など、さまざまな距離を試しましたが、うまくいきませんでした。