1

x、y 座標を使用した散布図は、他のプログラムを使用して取得したものとは異なる Matplotlib のプロットを提案します。たとえば、2 つの適合スコアに対する PCA の結果を次に示します。R を使った同じグラフでも同じデータでも表示が違う… Excell と Libreoffice でも確認したところ、R と同じ表示になっていました。物事をうまくやった。私の欠点は何ですか?

フロートが問題ではないことを確認し、座標の順序が同様であることを確認しました… R でプロットします。

mydata = read.csv("C:/Users/Anon/Desktop/data.txt")  # read csv file
summary(mydata)
attach(mydata) 
plot(mydata)

Rで作った散布図 ここに画像の説明を入力

Matplotlib でプロットされた同じデータ:

import matplotlib.pyplot as mpl
import numpy as np
import os
# open the file with PCA results and convert it into float
file_data = os.getcwd() + "\\data.txt"
F = open(file_data, 'r')
DATA=F.readlines()
F.close()
for x in range(len(DATA)) :
    a = DATA[x]
    b = a.split(',')
    DATA[x] = b
for i in xrange(len(DATA)):
    for j in xrange(len(DATA[i])):
        DATA[i][j] = float(DATA[i][j])
print DATA[0]
X_train = np.mat(DATA)
print "X_train\n",X_train

mpl.scatter(X_train[:, 0], X_train[:, 1], c='white')
mpl.show()

Matplotlib で作成した散布図 および X_train を印刷した結果 (データが同じであることを確認できます) Excell の場合 ここに画像の説明を入力 : ここに画像の説明を入力

data: (すべてのデータを入れることはできません。*.txt ファイルの結合方法を教えてください ~40.5 Ko)

0.02753547770433    -0.037999362802379
0.05179194064903    0.0257492713593311
-0.0272928319004863 0.0065143681863637
0.0891355504379135  -0.00801696955147688
0.0946809371499167  -0.00502202338807476
-0.0445799941736001 -0.0435759273767196
-0.333617999778119  -0.204222004815357
-0.127212025425053  -0.110264460064754
-0.0243459270896855 -0.0622273166478512
0.0497080821876597  0.0272080474151131
-0.181221703468915  -0.134945934382777
-0.0699503258694739 -0.0835239795690277

編集:したがって、PCAデータ(scipyから)をテキストファイルにエクスポートし、この共通テキストファイルをpython/matplotlibとRで開いて、PCAに関連するいくつかの問題を回避しました。プロットはその処理後に作成されました (そして、PCA の前のグラフはドームのように見えます)

edit2: numpy.loadtxt() を使用すると、R として表示されますが、カスタム メソッドと numpy.loadtxt() は同じデータ形状、サイズ、型、および値を提供したため、関係するメカニズムは何ですか?

X_train numpy.loadtxt()
[[ 0.02753548 -0.03799936]
 [ 0.05179194  0.02574927]
 [-0.02729283  0.00651437]
 ..., 
 [ 0.02670961 -0.00696177]
 [ 0.09011859 -0.00661216]
 [-0.04406559  0.09285291]] 
shape and size
(1039L, 2L) 2078

X_train custom-method
[[ 0.02753548 -0.03799936]
 [ 0.05179194  0.02574927]
 [-0.02729283  0.00651437]
 ..., 
 [ 0.02670961 -0.00696177]
 [ 0.09011859 -0.00661216]
 [-0.04406559  0.09285291]] 
shape and size
(1039L, 2L) 2078
4

2 に答える 2