Al pesarse a la misma hora cada día, se mejora la utilidad de los datos al controlar las variaciones diarias. Pero esas variaciones seguirán produciéndose, porque las básculas de consumo son terriblemente imprecisas y el cuerpo retiene más o menos líquido aparentemente al azar cada día.
Como se trata de una pregunta sencilla para un estudio sencillo, merece una respuesta práctica y sencilla: considerar la posibilidad de suavizar los datos. Utilice los valores suavizados en lugar de los valores reales para estimar los cambios durante cualquier intervalo simplemente restando el peso final del peso inicial.
El alisado es todo un arte, pero se puede hacer un buen trabajo trazando los datos y usando el buen juicio. Permítanme ilustrarlo con datos. Los trazados en este post se obtuvieron mediante pesajes regulares con la misma báscula de consumo a la misma hora del día, ajustados por el peso de la ropa. He desplazado las horas (y los pesos) para que podamos centrarnos en la cuestión general y no en las cifras concretas que se muestran; pero por lo demás, estos son datos reales. (Los pesos están en libras).
Como todos los datos reales, son imperfectos. En particular, aunque nominalmente los pesajes se realizaban todos los días, a veces falta el peso por diversas razones ajenas al mismo. Podemos considerar que estos valores faltan completamente al azar; no nos preocuparemos por ellos. Pero esta irregularidad en el tiempo es una razón para no utilizar métodos sofisticados de series temporales para el análisis.
Todos estos gráficos muestran la misma serie de datos , mostrados como puntos grises. Los gráficos difieren en la agresividad del suavizado. El "intervalo" de la clave de la derecha es, a grandes rasgos, la fracción de todos los puntos que contribuyen al valor suavizado en cualquier punto. Sólo se utilizaron los valores de los puntos vecinos, ponderados de modo que los puntos más cercanos contribuyan más que los más lejanos. Los tramos más grandes se suavizan más. A grandes rasgos, para este periodo de 1,25 años, "3/5" muestra las tendencias semestrales, "1/4" las trimestrales, "1/10" las mensuales y "1/24" las quincenales.
Aunque un lapso de 3/5 no sigue los datos de forma consistente, muestra el panorama general: el peso disminuyó de forma constante durante medio año y luego se estabilizó. Puedes utilizarlo para hacer comparaciones a largo plazo (para intervalos de un año o más).
El lapso de 1/4 parece seguir todas las grandes tendencias obvias. Además del patrón anual que se muestra a su izquierda, parece documentar una ciclo estacional de un ligero aumento de peso (2,5 libras) en primavera y otoño en comparación con el invierno y el verano.
Los detalles difíciles de detectar a ojo aparecen con una amplitud de 1/10, pero no parece que cambien mucho las cosas en comparación con el lapso de 1/4: su amplitud es de aproximadamente una libra. Para el seguimiento de los cambios de peso durante períodos de un mes o más, este o el anterior suave podrían ser las mejores opciones.
El liso con un lapso de 1/24 probablemente muestra más detalles de los que estos datos pueden soportar.
¿Cómo podemos saber que la última parcela puede estar mostrando demasiados detalles? Mirando los residuos, que son los errores cometidos al sustituir los datos brutos por sus suavizados. Formalmente: el residuo es la diferencia entre el peso bruto y su valor suavizado para esa fecha.
Los residuos para un lapso de 3/5 muestran patrones: tienden claramente por encima y por debajo de cero (su valor ideal). Muchos de esos residuos son sorprendentemente grandes, de varios kilos o más. ¡Eso es terrible para una báscula que lee en unidades de 0,1 libras! Sin embargo, no sólo incorpora el error de medición, sino también los cambios aleatorios, no correlacionados, variables en el propio cuerpo, como la cantidad de líquido que está reteniendo. Estos patrones desaparecen en gran medida mucho antes de que el intervalo llegue a 1/24, y la gran mayoría de los residuos son inferiores a una libra. Esta fluctuación es probablemente "ruido", es decir, un error de medición aleatorio y no correlacionado y una variación irreducible.
(Los períodos de residuos más pequeños son evidentes en las parcelas inferiores alrededor de mayo de 2020 y febrero de 2021, lo que sugiere que puede haber períodos en los que esas condiciones corporales variables cambiaron menos de un día a otro).
Si suavizáramos aún menos -y, por tanto, siguiéramos los datos aún más de cerca-, los residuos seguirían reduciéndose hasta llegar a cero, pero el suave sería simplemente el seguimiento del ruido aleatorio en lugar de seguir cualquier señal subyacente real que se quiera capturar.
¿Cómo se puede saber en qué momento hay que dejar de alisar? Aproximadamente, donde la amplitud de los residuos comienza a reducirse apreciablemente.
Para hacer esta trama, Hice 11 alisados con tramos que van de 1/48 a 2/3. Para cada uno calculé el difundir de los residuos como su tamaño medio: la mitad de los residuos tiene un tamaño mayor que la dispersión y la otra mitad tiene un tamaño menor.
Este gráfico muestra un claro "codo" cerca de un tramo de 0,1 (1/10). En este caso, los alisados con tramos más pequeños siguen tan de cerca los valores de los datos individuales que los residuos disminuyen rápidamente. Podemos interpretar la pendiente gradual de los tramos entre 1/10 y 2/3 como un reflejo de las variaciones de verdadero pesos que se recogen a medida que se varía la envergadura en este rango. La pendiente pronunciada para los tramos entre 1/48 y 1/10 refleja un régimen de suavizado diferente en el que el suavizado empieza a estar controlado por el error de medición.
Aunque puede suavizar los datos manualmente, El software lo hace fácil. Todos estos alisados fueron calculados instantáneamente por el loess
en la función R
paquete estadístico. (Muchos otros paquetes estadísticos tienen una versión de loess).
(Obsérvese que el "lapso" de loess es una fracción de todos los datos. Por lo tanto, su significado cambiará a medida que el conjunto de datos crezca. No puede suponer que el intervalo correcto para sus datos será la misma fracción que la mejor encontrada aquí (1/10), ni que se mantendrá constante mientras siga controlando. Tiene que analizar sus propios datos).
No hay que ser tan exigente a la hora de elegir el liso. Experimente con el primer o segundo mes de datos. No hagas un seguimiento demasiado exhaustivo de los datos. Suavizar lo justo para captar la visual tendencias que puedas ver. Luego, continúe suavizando en ese nivel mientras sigue controlando el peso.