pdist
scipyを呼び出すときに欠損値を指定するにはどうすればよいですか? つまり、ここで説明されている関数:
http://docs.scipy.org/doc/scipy/reference/generated/scipy.spatial.distance.pdist.html
たとえば、次の場合:
pdist(X, "euclidean")
しかしX
、文字列のような欠損値が含まれている可能性があり、それらを の列"NA"
間のペアごとの比較で除外する必要がありX
ます。私が探している動作は、の列のペア間のユークリッド距離を取得するときに欠損値を考慮しないことですX
。