Plano de mejor ajuste dado un conjunto de puntos

Question

Plano de mejor ajuste dado un conjunto de puntos

Preguntado el 15 de Enero, 2012: Cuando se hizo la pregunta
83018 visitas: Cuantas visitas ha tenido la pregunta
4 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

No hay nada más que explicar. Es que no sé cómo encontrar el mejor plano de ajuste dado un conjunto de $N$ puntos en un $3D$ espacio. Luego tengo que escribir el algoritmo correspondiente. Gracias ;)

Preguntado el 15 de Enero, 2012 por roadrunner66

5 votos

Hay mucho más que explicar. Hay muchas medidas diferentes para determinar lo bien que se ajusta un plano a unos datos determinados, y diferentes medidas dan lugar a diferentes planos de "mejor" ajuste. Así que será mejor que nos digas qué tienes en mente como medida de lo bien que se ajusta un plano a unos datos determinados.

Comentado el 15 de Enero, 2012 por user8269

0 votos

Lo siento, pero me gustaría poder decirte más. Pero sólo sé un poco. Digamos que el conjunto de Puntos que tengo (más de un centenar) ya se parecen a un plano, es decir, se visualizan como un plano pero no perfectamente. "Obtener el plano de simetría A ajustándolo al conjunto de puntos B.." Eso es todo lo que tengo que hacer. No dicen nada más.

Comentado el 16 de Enero, 2012 por roadrunner66

1 votos

No había mencionado antes la parte de la simetría, ¿sabe a qué se refiere?

Comentado el 16 de Enero, 2012 por JiminyCricket

Mostrar 3 comentarios más

Answer 1

4 Respuestas

Answer 2

47voto

JiminyCricket Puntos 143

Resta el centroide, forma un $3\times N$ matriz $\mathbf X$ de las coordenadas resultantes y calcular su descomposición del valor singular . El vector normal del plano mejor ajustado es el vector singular izquierdo correspondiente al menor valor singular. Véase esta respuesta para explicar por qué esto es numéricamente preferible al cálculo del vector propio de $\mathbf X\mathbf X^\top$ correspondiente al menor valor propio.

Aquí hay una implementación en Python, como se pidió:

import numpy as np

# generate some random test points 
m = 20 # number of points
delta = 0.01 # size of random displacement
origin = np.random.rand(3, 1) # random origin for the plane
basis = np.random.rand(3, 2) # random basis vectors for the plane
coefficients = np.random.rand(2, m) # random coefficients for points on the plane

# generate random points on the plane and add random displacement
points = basis @ coefficients \
         + np.tile(origin, (1, m)) \
         + delta * np.random.rand(3, m)

# now find the best-fitting plane for the test points

# subtract out the centroid and take the SVD
svd = np.linalg.svd(points - np.mean(points, axis=1, keepdims=True))

# Extract the left singular vectors
left = svd[0]

1 2

# the corresponding left singular vector is the normal vector of the best-fitting plane

left[:, -1]

2

# its dot product with the basis vectors of the plane is approximately zero

left[:, -1] @ basis

2

Respondido el 15 de Enero, 2012 por JiminyCricket (143 Puntos )

0 votos

Lo intentaré. Estaba pensando, ¿y si utilizo el algoritmo PCA en su lugar? Porque mi conjunto de puntos siempre se va a mostrar como un plano, así que sólo necesito encontrar la ecuación. Con PCA puedo encontrar las direcciones más relevantes y luego encontrar fácilmente un plano. ¿Estoy pensando mal?

Comentado el 16 de Enero, 2012 por roadrunner66

0 votos

@G4bri3l: ¿Has seguido el enlace?

Comentado el 16 de Enero, 2012 por JiminyCricket

0 votos

Sí, he visto el enlace. Pero como ya he implementado el algoritmo PCA y en realidad no me importa si es numéricamente no preferible, tal vez debería usarlo. Pero probablemente encontraré un algoritmo ya implementado para el SVD, así que debería usarlo en lugar del PCA. ¡Gracias @joriki, esto fue realmente útil!

Comentado el 16 de Enero, 2012 por roadrunner66

Mostrar 21 comentarios más

Answer 3

46voto

Ben Puntos 459

Una simple solución de mínimos cuadrados debería ser suficiente.

La ecuación de un plano es: $ax + by + c = z$ . Así que establece matrices como esta con todos tus datos:

$$ \begin{bmatrix} x_0 & y_0 & 1 \\ x_1 & y_1 & 1 \\ &... \\ x_n & y_n & 1 \\ \end{bmatrix} \begin{bmatrix} a \\ b \\ c \end{bmatrix} = \begin{bmatrix} z_0 \\ z_1 \\ ... \\ z_n \end{bmatrix} $$ En otras palabras:

$$Ax = B$$

Ahora resuelve para $x$ que son sus coeficientes. Pero como (supongo) tienes más de 3 puntos, el sistema está sobredeterminado, así que necesitas usar la pseudoinversa de la izquierda: $A^+ = (A^T A)^{-1} A^T$ . Así que la respuesta es: $$ \begin{bmatrix} a \\ b \\ c \end{bmatrix} = (A^T A)^{-1} A^T B $$

Y aquí hay un sencillo código Python con un ejemplo:

import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import numpy as np

# These constants are to create random data for the sake of this example
N_POINTS = 10
TARGET_X_SLOPE = 2
TARGET_y_SLOPE = 3
TARGET_OFFSET  = 5
EXTENTS = 5
NOISE = 5

# Create random data.
# In your solution, you would provide your own xs, ys, and zs data.
xs = [np.random.uniform(2*EXTENTS)-EXTENTS for i in range(N_POINTS)]
ys = [np.random.uniform(2*EXTENTS)-EXTENTS for i in range(N_POINTS)]
zs = []
for i in range(N_POINTS):
    zs.append(xs[i]*TARGET_X_SLOPE + \
              ys[i]*TARGET_y_SLOPE + \
              TARGET_OFFSET + np.random.normal(scale=NOISE))

# plot raw data
plt.figure()
ax = plt.subplot(111, projection='3d')
ax.scatter(xs, ys, zs, color='b')

# do fit
tmp_A = []
tmp_b = []
for i in range(len(xs)):
    tmp_A.append([xs[i], ys[i], 1])
    tmp_b.append(zs[i])
b = np.matrix(tmp_b).T
A = np.matrix(tmp_A)

# Manual solution
fit = (A.T * A).I * A.T * b
errors = b - A * fit
residual = np.linalg.norm(errors)

# Or use Scipy
# from scipy.linalg import lstsq
# fit, residual, rnk, s = lstsq(A, b)

print("solution: %f x + %f y + %f = z" % (fit[0], fit[1], fit[2]))
print("errors: \n", errors)
print("residual:", residual)

# plot plane
xlim = ax.get_xlim()
ylim = ax.get_ylim()
X,Y = np.meshgrid(np.arange(xlim[0], xlim[1]),
                  np.arange(ylim[0], ylim[1]))
Z = np.zeros(X.shape)
for r in range(X.shape[0]):
    for c in range(X.shape[1]):
        Z[r,c] = fit[0] * X[r,c] + fit[1] * Y[r,c] + fit[2]
ax.plot_wireframe(X,Y,Z, color='k')

ax.set_xlabel('x')
ax.set_ylabel('y')
ax.set_zlabel('z')
plt.show()

Respondido el 1 de Junio, 2017 por Ben (459 Puntos )

17 votos

¿Estoy en lo cierto al interpretar que este método resolverá para el plano que minimiza la vertical (es decir: z) y no la distancia perpendicular ¿Distancia?

Comentado el 9 de Noviembre, 2017 por Kari

12 votos

Sí, minimiza la distancia vertical.

Comentado el 9 de Noviembre, 2017 por Ben

0 votos

Muchas gracias por aclarar esto Ben (y por la respuesta) Si tienes tiempo, tengo una pregunta muy parecida aquí (utilizando la descomposición de valor singular) que me está dando problemas.

Comentado el 9 de Noviembre, 2017 por Kari

Mostrar 7 comentarios más

Answer 4

4voto

Claude Leibovici Puntos 54392

Considerando un plano de ecuación $Ax+By+Cz=0$ y un punto de coordenadas $(x_i,y_i,z_i)$ la distancia viene dada por $$d_i=\pm\frac{Ax_i+By_i+Cz_i}{\sqrt{A^2+B^2+C^2}}$$ y supongo que quieres minimizar $$F=\sum_{i=1}^n d_i^2=\sum_{i=1}^n\frac{(Ax_i+By_i+Cz_i)^2}{{A^2+B^2+C^2}}$$ Configurar $C=1$ entonces tenemos que minimizar con respecto a $A,B$ $$F=\sum_{i=1}^n\frac{(Ax_i+By_i+z_i)^2}{{A^2+B^2+1}}$$ Tomar derivados $$F'_A=\sum _{i=1}^n \left(\frac{2 x_i (A x_i+B y_i+z_i)}{A^2+B^2+1}-\frac{2 A (A x_i+B y_i+z_i)^2}{\left(A^2+B^2+1\right)^2}\right)$$ $$F'_B=\sum _{i=1}^n \left(\frac{2 y_i (A x_i+B y_i+z_i)}{A^2+B^2+1}-\frac{2 B (A x_i+B y_i+z_i)^2}{\left(A^2+B^2+1\right)^2}\right)$$ Dado que fijaremos estas derivadas iguales a $0$ las ecuaciones pueden simplificarse a $$\sum _{i=1}^n \left({ x_i (A x_i+B y_i+z_i)}-\frac{ A (A x_i+B y_i+z_i)^2}{\left(A^2+B^2+1\right)}\right)=0$$ $$\sum _{i=1}^n \left({ y_i (A x_i+B y_i+z_i)}-\frac{ B (A x_i+B y_i+z_i)^2}{\left(A^2+B^2+1\right)}\right)=0$$ que son no lineales con respecto a los parámetros $A,B$ ; entonces, se requieren buenas estimaciones ya que probablemente se utilizará Newton-Raphson para pulir las soluciones.

Se pueden obtener haciendo primero una regresión multilineal (sin intercepción en su caso) $$z=\alpha x+\beta y$$ y utilizar $A=-\alpha$ y $B=-\beta$ para iniciar el proceso iterativo. Los valores vienen dados por $$A=-\frac{\text{Sxy} \,\text{Syz}-\text{Sxz}\, \text{Syy}}{\text{Sxy}^2-\text{Sxx}\, \text{Syy}}\qquad B=-\frac{\text{Sxy}\, \text{Sxz}-\text{Sxx}\, \text{Syz}}{\text{Sxy}^2-\text{Sxx}\, \text{Syy}}$$

A modo de ejemplo, consideraré los siguientes datos $$\left( \begin{array}{ccc} x & y & z \\ 1 & 1 & 9 \\ 1 & 2 & 14 \\ 1 & 3 & 20 \\ 2 & 1 & 11 \\ 2 & 2 & 17 \\ 2 & 3 & 23 \\ 3 & 1 & 15 \\ 3 & 2 & 20 \\ 3 & 3 & 26 \end{array} \right)$$

El paso previo da $z=2.97436 x+5.64103 y$ y resolviendo las ecuaciones rigurosas se llega a $A=-2.97075$ , $B=-5.64702$ que se acercan bastante a las estimaciones (debido a los pequeños errores).

Respondido el 11 de Febrero, 2016 por Claude Leibovici (54392 Puntos )

1 votos

En tu ejemplo, la ecuación del plano $z=Ax+By$ se realiza con respecto al criterio de las distancias ortogonales al cuadrado mínimo entre los puntos y el plano. Estoy de acuerdo con tu resultado. Pero, son sólo dos parámetros ajustables $A,B$ porque el origen $(0,0,0)$ se supone que está en el plan. Se trata de una condición adicional. Si consideramos la ecuación más general del plan $z=Ax+By+C$ el problema de los tres parámetros debería conducir a un mejor ajuste con una desviación cuadrática media menor.

Comentado el 12 de Febrero, 2016 por ILIV

Answer 5

4voto

ILIV Puntos 421

Para completar la respuesta de Claude Leibovici :

Con el ejemplo numérico propuesto por Claude Leibovici que calculó los parámetros de un plano ajustado $\quad z=Ax+By\quad$ el ajuste del plano $\quad Z=\alpha X+\beta Y+\gamma\quad$ puede llevarse a cabo gracias al método de componentes principales (como sugiere joriki).

La teoría se puede encontrar en muchos libros. En las páginas 24-25 del documento se ofrece una sinopsis: https://fr.scribd.com/doc/31477970/Regressions-et-trajectoires-3D

Los símbolos utilizados a continuación corresponden a los de las fórmulas del documento de referencia.

Respondido el 12 de Febrero, 2016 por ILIV (421 Puntos )

Plano de mejor ajuste dado un conjunto de puntos

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Plano de mejor ajuste dado un conjunto de puntos

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: