24

一連の 3D データ ポイントから直線の方程式を返すアルゴリズムはありますか? 2D データ セットから直線の方程式を与えるソースはたくさんありますが、3D にはありません。

ありがとう。

4

2 に答える 2

55

他の 2 つの値から 1 つの値を予測しようとしている場合はlstsqa引数を独立変数 (および切片を推定するための 1 の列) およびb従属変数として使用する必要があります。

一方、データに最適な線、つまり、データを投影した場合に実際の点とその投影の間の距離の 2 乗が最小になる線を取得したいだけの場合は、次のようにします。は第一主成分です。

それを定義する 1 つの方法は、データの平均を通過する最大固有値に対応する共分散行列の固有ベクトルを方向ベクトルとする線です。とは言っeig(cov(data))ても、それを計算するには本当に悪い方法です。これは、多くの不必要な計算とコピーを行い、 を使用するよりも精度が低くなる可能性があるためsvdです。下記参照:

import numpy as np

# Generate some data that lies along a line

x = np.mgrid[-2:5:120j]
y = np.mgrid[1:9:120j]
z = np.mgrid[-5:3:120j]

data = np.concatenate((x[:, np.newaxis], 
                       y[:, np.newaxis], 
                       z[:, np.newaxis]), 
                      axis=1)

# Perturb with some Gaussian noise
data += np.random.normal(size=data.shape) * 0.4

# Calculate the mean of the points, i.e. the 'center' of the cloud
datamean = data.mean(axis=0)

# Do an SVD on the mean-centered data.
uu, dd, vv = np.linalg.svd(data - datamean)

# Now vv[0] contains the first principal component, i.e. the direction
# vector of the 'best fit' line in the least squares sense.

# Now generate some points along this best fit line, for plotting.

# I use -7, 7 since the spread of the data is roughly 14
# and we want it to have mean 0 (like the points we did
# the svd on). Also, it's a straight line, so we only need 2 points.
linepts = vv[0] * np.mgrid[-7:7:2j][:, np.newaxis]

# shift by the mean to get the line in the right place
linepts += datamean

# Verify that everything looks right.

import matplotlib.pyplot as plt
import mpl_toolkits.mplot3d as m3d

ax = m3d.Axes3D(plt.figure())
ax.scatter3D(*data.T)
ax.plot3D(*linepts.T)
plt.show()

外観は次のとおりです。適合線の 3 次元プロット

于 2010-02-25T10:28:15.727 に答える
5

データが適切に動作している場合は、成分距離の最小二乗和を見つけるだけで十分です。次に、z が x に依存せず、y に依存しない線形回帰を見つけることができます。

ドキュメントの例に従ってください:

import numpy as np

pts = np.add.accumulate(np.random.random((10,3)))
x,y,z = pts.T

# this will find the slope and x-intercept of a plane
# parallel to the y-axis that best fits the data
A_xz = np.vstack((x, np.ones(len(x)))).T
m_xz, c_xz = np.linalg.lstsq(A_xz, z)[0]

# again for a plane parallel to the x-axis
A_yz = np.vstack((y, np.ones(len(y)))).T
m_yz, c_yz = np.linalg.lstsq(A_yz, z)[0]

# the intersection of those two planes and
# the function for the line would be:
# z = m_yz * y + c_yz
# z = m_xz * x + c_xz
# or:
def lin(z):
    x = (z - c_xz)/m_xz
    y = (z - c_yz)/m_yz
    return x,y

#verifying:
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt

fig = plt.figure()
ax = Axes3D(fig)
zz = np.linspace(0,5)
xx,yy = lin(zz)
ax.scatter(x, y, z)
ax.plot(xx,yy,zz)
plt.savefig('test.png')
plt.show()

ライン(ラインに直交する)から3空間のポイントまでの実際の直交距離を最小化したい場合(これは線形回帰と呼ばれることさえありません)。次に、RSS を計算する関数を作成し、scipy.optimize 最小化関数を使用してそれを解決します。

于 2010-02-21T04:54:58.330 に答える