Esta es una situación simple; mantengámosla así. La clave es centrarse en lo que importa:
-
Obtención de una descripción útil de los datos.
-
Evaluar las desviaciones individuales de esa descripción.
-
Evaluar el posible papel e influencia del azar en la interpretación.
-
Mantener la integridad intelectual y la transparencia.
Todavía hay muchas opciones y muchas formas de análisis serán válidas y eficaces. Vamos a ilustrar aquí un enfoque que puede recomendarse por su adhesión a estos principios clave.
Para mantener la integridad, Vamos a dividir los datos en mitades: las observaciones de 1972 a 1990 y las de 1991 a 2009 (19 años en cada una). Vamos a ajustar los modelos a la primera mitad y luego veremos qué tal funcionan los ajustes para proyectar la segunda mitad. Esto tiene la ventaja añadida de detectar los cambios significativos que puedan haberse producido durante la segunda mitad.
Para obtener una descripción útil, necesitamos (a) encontrar una manera de medir los cambios y (b) ajustar el modelo más simple posible apropiado para esos cambios, evaluarlo, y ajustar iterativamente otros más complejos para acomodar las desviaciones de los modelos simples.
(a) Tienes muchas opciones: puedes mirar los datos brutos; puedes mirar sus diferencias anuales; puedes hacer lo mismo con los logaritmos (para evaluar los cambios relativos); puedes evaluar los años de vida perdidos o la esperanza de vida relativa (EVR); o muchas otras cosas. Después de pensarlo un poco, decidí considerar la EVR, definida como la relación entre la esperanza de vida de la cohorte B y la de la cohorte A (de referencia). Afortunadamente, como muestran los gráficos, la esperanza de vida de la cohorte A aumenta regularmente de forma estable a lo largo del tiempo, por lo que la mayor parte de la variación de aspecto aleatorio de la EVR se deberá a los cambios en la cohorte B.
(b) El modelo más simple posible para empezar es una tendencia lineal. Veamos qué tal funciona.
![Figure 1]()
Los puntos azules oscuros de este gráfico son los datos retenidos para el ajuste; los puntos dorados claros son los datos posteriores, no utilizados para el ajuste. La línea negra es el ajuste, con una pendiente de 0,009/año. Las líneas discontinuas son los intervalos de predicción de los distintos valores futuros.
En general, el ajuste parece bueno: El examen de los residuos (véase más adelante) no muestra cambios importantes en su tamaño a lo largo del tiempo (durante el periodo de datos 1972-1990). (Hay algunos indicios de que tendían a ser mayores al principio, cuando la esperanza de vida era baja. Podríamos manejar esta complicación sacrificando algo de simplicidad, pero es poco probable que los beneficios para estimar la tendencia sean grandes). Sólo hay un pequeño indicio de correlación serial (exhibido por algunas series de residuos positivos y negativas), pero claramente esto no es importante. No hay valores atípicos, que estarían indicados por puntos más allá de las bandas de predicción.
La única sorpresa es que en 2001 los valores cayeron repentinamente a la banda inferior de predicción y se quedaron ahí: algo bastante repentino y grande ocurrió y persistió.
Aquí están los residuos, que son los desviaciones de la descripción mencionada anteriormente.
![Figure 2]()
Como queremos comparar los residuos con 0, se dibujan líneas verticales hasta el nivel cero como ayuda visual. De nuevo, los puntos azules muestran los datos utilizados para el ajuste. Los de color dorado claro son los residuos de los datos que caen cerca del límite inferior de predicción, después del año 2000.
A partir de esta cifra podemos estimar que el efecto del cambio de 2000-2001 fue de aproximadamente -0,07 . Esto refleja una caída repentina de 0,07 (7%) de una vida completa dentro de la cohorte B. Después de esa caída, el patrón horizontal de los residuos muestra que la tendencia anterior continuó, pero en el nuevo nivel más bajo. Esta parte del análisis debe considerarse exploratorio : no estaba previsto específicamente, sino que surgió debido a una sorprendente comparación entre los datos retenidos (1991-2009) y el ajuste al resto de los datos.
Otra cosa: incluso utilizando sólo los 19 primeros años de datos, el error estándar de la pendiente es pequeño: es sólo 0,0009, apenas una décima parte del valor estimado de 0,009. El correspondiente estadístico t de 10, con 17 grados de libertad, es extremadamente significativo (el valor p es inferior a $10^{-7}$ ); es decir, podemos estar seguros de que la tendencia no se debe al azar. Esta es una parte de nuestra evaluación del papel del azar en el análisis. Las otras partes son los exámenes de los residuos.
No parece haber ninguna razón para ajustar un modelo más complicado a estos datos, al menos no para estimar si hay una verdadera tendencia en la RLE a lo largo del tiempo: la hay. Podríamos ir más allá y dividir los datos en valores anteriores a 2001 y posteriores a 2000 para afinar nuestra estimaciones de las tendencias, pero no sería del todo honesto realizar pruebas de hipótesis. Los valores p serían artificialmente bajos, porque las pruebas de división no se planificaron de antemano. Pero como ejercicio exploratorio, esa estimación está bien. Aprenda todo lo que pueda de sus datos. Sólo hay que tener cuidado de no engañarse a sí mismo con el sobreajuste (que es casi seguro que ocurrirá si se utiliza más de media docena de parámetros o se emplean técnicas de ajuste automatizadas), o con el fisgoneo de los datos: manténgase alerta ante la diferencia entre la confirmación formal y la exploración informal (pero valiosa) de los datos.
Resumamos:
-
Seleccionando una medida adecuada de la esperanza de vida (la RLE), reteniendo la mitad de los datos, ajustando un modelo sencillo y probando ese modelo con los datos restantes, hemos establecido con gran confianza que La tendencia ha sido consistente, se ha acercado a la linealidad durante un largo periodo de tiempo y ha habido una caída repentina y persistente de la RLE en 2001.
-
Nuestro modelo es sorprendentemente parsimonioso El modelo de la curva de la derecha: sólo necesita dos números (una pendiente y un intercepto) para describir los primeros datos con exactitud. Necesita un tercero (la fecha de la ruptura, 2001) para describir una desviación evidente pero inesperada de esta descripción. No hay valores atípicos en relación con esta descripción de tres parámetros. El modelo no va a mejorar sustancialmente caracterizando la correlación serial (el objetivo de las técnicas de series temporales en general), intentando describir las pequeñas desviaciones individuales (residuos) exhibidas, o introduciendo ajustes más complicados (como añadir un componente temporal cuadrático o modelar los cambios en el tamaño de los residuos a lo largo del tiempo).
-
La tendencia ha sido de 0,009 RLE por año . Esto significa que con cada año que pasa, la esperanza de vida dentro de la cohorte B ha tenido un 0,009 (casi el 1%) de una vida normal esperada completa. En el transcurso del estudio (37 años), esto equivaldría a 37*0,009 = 0,34, es decir, un tercio de la mejora de toda una vida. El retroceso de 2001 redujo esa ganancia a cerca de 0,28 de una vida completa entre 1972 y 2009 (aunque durante ese periodo la esperanza de vida global aumentó un 10%).
-
Aunque este modelo podría mejorarse, probablemente necesitaría más parámetros y es poco probable que la mejora sea grande (como atestigua el comportamiento casi aleatorio de los residuos). En conjunto, pues, deberíamos estar contentos para llegar a ese compacto y útil, simple descripción de los datos para tan poco trabajo de análisis.