x、y 座標を使用した散布図は、他のプログラムを使用して取得したものとは異なる Matplotlib のプロットを提案します。たとえば、2 つの適合スコアに対する PCA の結果を次に示します。R を使った同じグラフでも同じデータでも表示が違う… Excell と Libreoffice でも確認したところ、R と同じ表示になっていました。物事をうまくやった。私の欠点は何ですか?
フロートが問題ではないことを確認し、座標の順序が同様であることを確認しました… R でプロットします。
mydata = read.csv("C:/Users/Anon/Desktop/data.txt") # read csv file
summary(mydata)
attach(mydata)
plot(mydata)
Rで作った散布図
Matplotlib でプロットされた同じデータ:
import matplotlib.pyplot as mpl
import numpy as np
import os
# open the file with PCA results and convert it into float
file_data = os.getcwd() + "\\data.txt"
F = open(file_data, 'r')
DATA=F.readlines()
F.close()
for x in range(len(DATA)) :
a = DATA[x]
b = a.split(',')
DATA[x] = b
for i in xrange(len(DATA)):
for j in xrange(len(DATA[i])):
DATA[i][j] = float(DATA[i][j])
print DATA[0]
X_train = np.mat(DATA)
print "X_train\n",X_train
mpl.scatter(X_train[:, 0], X_train[:, 1], c='white')
mpl.show()
および X_train を印刷した結果 (データが同じであることを確認できます) Excell の場合
:
data: (すべてのデータを入れることはできません。*.txt ファイルの結合方法を教えてください ~40.5 Ko)
0.02753547770433 -0.037999362802379
0.05179194064903 0.0257492713593311
-0.0272928319004863 0.0065143681863637
0.0891355504379135 -0.00801696955147688
0.0946809371499167 -0.00502202338807476
-0.0445799941736001 -0.0435759273767196
-0.333617999778119 -0.204222004815357
-0.127212025425053 -0.110264460064754
-0.0243459270896855 -0.0622273166478512
0.0497080821876597 0.0272080474151131
-0.181221703468915 -0.134945934382777
-0.0699503258694739 -0.0835239795690277
編集:したがって、PCAデータ(scipyから)をテキストファイルにエクスポートし、この共通テキストファイルをpython/matplotlibとRで開いて、PCAに関連するいくつかの問題を回避しました。プロットはその処理後に作成されました (そして、PCA の前のグラフはドームのように見えます)
edit2: numpy.loadtxt() を使用すると、R として表示されますが、カスタム メソッドと numpy.loadtxt() は同じデータ形状、サイズ、型、および値を提供したため、関係するメカニズムは何ですか?
X_train numpy.loadtxt()
[[ 0.02753548 -0.03799936]
[ 0.05179194 0.02574927]
[-0.02729283 0.00651437]
...,
[ 0.02670961 -0.00696177]
[ 0.09011859 -0.00661216]
[-0.04406559 0.09285291]]
shape and size
(1039L, 2L) 2078
X_train custom-method
[[ 0.02753548 -0.03799936]
[ 0.05179194 0.02574927]
[-0.02729283 0.00651437]
...,
[ 0.02670961 -0.00696177]
[ 0.09011859 -0.00661216]
[-0.04406559 0.09285291]]
shape and size
(1039L, 2L) 2078