python - Numpy、Pandas、Sklearn での多次元スケーリングフィッティング (ValueError)

Question

sklearn、pandas、numpy で多次元スケーリングを試しています。私が使用しているデータファイルには 10 個の数値列があり、欠損値はありません。私はこの 10 次元のデータを取り、次のように sklearn.manifold の多次元スケーリングを使用して 2 次元で視覚化しようとしています。

import numpy as np
import pandas as pd
from sklearn import manifold
from sklearn.metrics import euclidean_distances

seed = np.random.RandomState(seed=3)
data = pd.read_csv('data/big-file.csv')

#  start small dont take all the data, 
#  its about 200k records
subset = data[:10000]
similarities = euclidean_distances(subset)

mds = manifold.MDS(n_components=2, max_iter=3000, eps=1e-9, 
      random_state=seed, dissimilarity="precomputed", n_jobs=1)

pos = mds.fit(similarities).embedding_

しかし、私はこの値のエラーが発生します:

Traceback (most recent call last):
  File "demo/mds-demo.py", line 18, in <module>
    pos = mds.fit(similarities).embedding_
  File "/Users/dwilliams/Desktop/Anaconda/lib/python2.7/site-packages/sklearn/manifold/mds.py", line 360, in fit
    self.fit_transform(X, init=init)
  File "/Users/dwilliams/Desktop/Anaconda/lib/python2.7/site-packages/sklearn/manifold/mds.py", line 395, in fit_transform
eps=self.eps, random_state=self.random_state)
  File "/Users/dwilliams/Desktop/Anaconda/lib/python2.7/site-packages/sklearn/manifold/mds.py", line 242, in smacof
eps=eps, random_state=random_state)
  File "/Users/dwilliams/Desktop/Anaconda/lib/python2.7/site-packages/sklearn/manifold/mds.py", line 73, in _smacof_single
raise ValueError("similarities must be symmetric")
ValueError: similarities must be symmetric

euclidean_distances は対称行列を返すと思いました。私は何を間違っていますか、どうすれば修正できますか?

python - Numpy、Pandas、Sklearn での多次元スケーリング フィッティング (ValueError)

2 に答える 2

Related

Reference

python - Numpy、Pandas、Sklearn での多次元スケーリングフィッティング (ValueError)