5 votos

Normalización o pérdida de tendencia de grupos de muestras

¿Cómo detraigo o normalizo varias series de datos para poder compararlas?


Es posible que los detalles que figuran a continuación no sean apropiados para este foro. Por favor, hágamelo saber y puedo eliminar o reformular, pero creo que podría ser útil para comprender plenamente la pregunta genérica anterior.

Tengo un conjunto de datos que me gustaría analizar. Creo que esta pregunta pertenece aquí y no en en https://gis.stackexchange.com/

Concretamente, me encuentro en la siguiente situación: Cada serie se recoge de un avión que vuela una trayectoria, y tiene un número variable de (valor, lat,lon,hora) tuplas. Tengo varias de estas trayectorias de vuelo, cada una en un momento diferente, y volando diferentes caminos (a veces se cruzan, a veces no). Los vuelos ocurrieron con meses de diferencia, a diferentes horas del día, y debido a fenómenos naturales, los datos (térmicos en este caso) varían.

Parte de la región sobrevolada por múltiples vuelos puede tener o no una firma de temperatura anómala. Esto es lo que quiero investigar. Busco un algoritmo que desvirtúe o normalice todos los vuelos para poder aumentar mi SNR y determinar si existe una anomalía de temperatura en una subregión.

5voto

La modelización multinivel, en la que los datos se agrupan por vuelos como una variable aleatoria, parece un buen método de análisis para este problema. En R el código podría ser

library(lme4) #load the package)
lmer(temp ~ region + (1|flight))

Esto se puede hacer con diversos paquetes estadísticos. Si la región es simplemente dentro de la región o fuera de la región, debe utilizarse una forma logística.

Para responder directamente a su pregunta sobre la normalización, puede que le interese

temp - (mean_temp_for_flight - mean_temp)

Esto pone a cero las temperaturas en la media global corregida para la media de vuelo individual. Así, si un vuelo tuvo una temperatura media de 20 sobre la región, y la temperatura media de la región es 18, y su muestra es 22, entonces el valor normalizado sería

22 - (20 - 18) = 20

Esencialmente... por vuelo se elimina la variabilidad.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X