私は正規分布をしています。この母集団からの 2 つの入力確率を比較して、それらがどの程度「類似」しているかを測定したいと思います。すべてが主観的ですが、正規分布に対するある種の方程式を使用して、x は y よりも y よりも「似ている」と言えるようにしたかったのです。
たとえば、母集団の平均が 10 で、標準偏差が 3 の場合、簡単なアルゴリズムで、2 つの点 (19 と 17) が他の 2 つの点 (9 と 10) よりも類似していると判断するようにします。ポイント17を取得する可能性ははるかに低く(平均から2シグマ以上離れているため)、したがって、別のランダムポイントをその最初のポイントの近くに低い確率で取得すると、発生する2つのポイントをほぼ同等に比較するよりも高い類似性を示しますより高い確率。
P(X < p1) - P(X < p2) のようなものを使用すると、両方のポイントが同じ場合に 0 になる可能性があるため、十分ではありません。ただし、9 と 9 の 2 つのポイントを取得すると、20 は 9 よりも発生する可能性がはるかに低いため、2 つのポイント (20 と 20) よりも類似度が低くなります。
上記の違いを使用する必要があるように感じますが、どういうわけか平均とシグマも使用して類似性の「式」を定式化します。
私が上でやろうとしていることを捉える既存の統計テストはありますか? そうでない場合、上記の問題を解決する方法について誰か提案がありますか?
ありがとうございました!