0

n 個の特徴を持つ m 個の 1-D バイナリ ベクトルがある場合に、外れ値ベクトルを特定する最適な方法を調査しています。たとえば、次のようになります。

a =[[1, 0, 1, 1, 1, 0, 1],
    [0, 0, 0, 1, 1, 1, 0],
    [0, 1, 1, 0, 0, 1, 1]]

私の場合、n と m は 100 です。どのベクトルが母集団の外れ値であるかを特定したいと思います。SciPy のマハラノビス距離と HDBSCAN などのパッケージを使用して、いくつかの情報を見つけました (注: これらの外れ値が識別された後、これらの外れ値をクラスタリングして、外れ値にさらにパターンがあるかどうかを確認します)。どちらの場合も例は限られていますが、これがバイナリ ベクトルで使用する最良の方法かどうかもわかりません。アドバイスや例、参考文献をいただければ幸いです。

4

0 に答える 0