5 votos

¿Puedo utilizar el análisis de curvas principales para ajustar una nube de vectores en lugar de una nube de puntos?

Recientemente he descubierto Curvas principales al tratar de resolver el problema que describiré a continuación.

El principio de las curvas principales consiste en ajustar un punto de la nube para encontrar el "camino" que recorre ese punto.

Mi objetivo es utilizar algo así para ajustar un conjunto de tracklogs de GPS que recorran una carretera, de modo que el resultado sea una aproximación estadística de la carretera "real" (o, más exactamente, la región de la carretera por la que la gente -los ciclistas en este caso- circula REALMENTE, que muy probablemente serían los carriles laterales y los arcenes de la carretera).

El problema es que, mientras que el análisis clásico de curvas principales considera que el conjunto de puntos es independiente puntos Creo que sería más apropiado considerar cada pista que se compone de vectores dependientes .

Cuando se utilizan puntos, por ejemplo, un segmento de pista con alta tasa de muestreo podría causar un sesgo cuando se compara con otro con menor tasa de muestreo, aunque cada uno de ellos describe sólo UNA trayectoria cada uno, y estoy más interesado en ponderar las trayectorias entre sí en lugar de los puntos individuales. (por cierto, ¿tiene sentido este razonamiento mío?)

He publicado una pregunta sobre el mismo tema, pero con diferente formulación, en el sitio Gis.StackExchange, con algunas imágenes representativas:

https://gis.stackexchange.com/questions/70623/how-can-i-statistically-calculate-the-real-road-from-a-set-of-gps-tracks

Gracias por leer.

3voto

David J. Sokol Puntos 1730

Esto parece un problema de datos funcionales; las trayectorias individuales podrían verse como realizaciones de alguna curva suave subyacente (función) que se desea estimar.

Jim Ramsay tiene un bonito sitio web sobre la FDA con varios ejemplos, que pueden darle una idea de lo que es la FDA y lo que puede hacer.

Mirando el comentario de @whuber (en el gis.se Q&A) respecto a la autocorrelación, que me recuerda a algunos trabajos de Rob Hyndman (@RobHyndman, también de esta parroquia) sobre series temporales funcionales. No es lo mismo que menciona @whuber (las series temporales funcionales verían las realizaciones individuales como observadas secuencialmente en el tiempo, es decir, las series de pistas representan una serie temporal), pero podría darte ideas sobre cómo considerar el manejo de la autocorrelación en los datos.

En cuanto a las curvas principales, los suavizadores que se ajustan a cada variable y que describen la ubicación de la curva a lo largo de esa dimensión son esencialmente componentes complementarios de la técnica, al menos en la forma en que Hastie y Steutzle describieron originalmente el método. Se podría adaptar fácilmente el código de la curva principal en el paquete R princurve para utilizar un plugin de suavizado que ajuste las curvas permitiendo la correlación residual, por ejemplo, basando el plugin de suavizado en el gamm() de la función mgcv que puede aplicar ciertas estructuras de correlación para la matriz de covarianza del modelo ajustado. Hacerlo no es demasiado difícil, técnicamente; yo mismo lo he hecho recientemente para utilizar GAMs de Poisson como suavizadores en lugar de simples splines de suavizado.

Si esto parece una sugerencia a medias, lo es; la ofrezco como algunas observaciones, ya que la pregunta aún no ha sido contestada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X