4 votos

Pruebas de hipótesis: pequeños cambios de series temporales.

He pares de unicc que son la estimación de la misma cantidad a lo largo de los años. Es algunos datos de supervivencia: el número de "muertos" de los sujetos durante el año por el número total de sujetos en el comienzo del año. Los datos subyacentes es revisado periódicamente, por lo que necesito para evaluar el efecto de los cambios. A continuación se da un ejemplo.

the two series

Quiero específicamente para probar si la media (que es el parámetro de interés) es el mismo para el unicc pares (el análisis se repite para un montón de pares, por favor, no se centran demasiado en la imagen en particular a pesar de que es bastante representativo).

Tengo varias preguntas:

  1. Debo usar un par de prueba o no?
  2. Si está emparejado, ¿cómo lidiar con los lazos, es decir, cero diferencias (yo siempre tengo un montón de lazos)?
  3. Creo que bootstrapping puede ser útil en este caso. He bootstrap de la media muestral de la diferencia. Esto da una distribución centrada en torno a la observada diferencia de medias. ¿Cómo puedo calcular el p-valor de esta distribución? Sería razonable para el arranque de la prueba de t de lugar?

1voto

mat_geek Puntos 1367

Obviamente, el tiempo es el factor más importante por lo que si están midiendo la misma cosa al mismo tiempo en lugar de a quedado a la par de veces con ellos, de modo que los valores de los pares se produjo al mismo tiempo. Pero entonces usted puede tener un problema mediante la prueba de t pareada o la de Wilcoxon signed rank test debido a que los pares son dependientes. (x(t), y(t)) se correlaciona con una (x(t+1), y(t+1)) en virtud de la correlación de las series individuales.

Arranque puede evitar la distribución de la hipótesis y puede incorporar la estructura de las correlaciones. Pero decir que "bootstrap las diferencias de medias" no explica lo que hizo. Usted podría bootstrap cada una de las series de tiempo utilizando mover el bloque de bootstrap o cualquier otro tipo de bloque de bootstrap o puede adaptarse a las series de tiempo modelos ARMA y bootstrap de residuos o vectores. Cualquiera que sea la forma de hacer esto usted ha tomado la correlación en cuenta en la formación de la secuencia de arranque de la serie de tiempo de conjuntos de datos. Cada vez que el bootstrap de obtener un bootstrap de la media de la muestra diferencia. Usted puede utilizar el bootstrap (Monte Carlo aproximado) de distribución para generar intervalo de confianza utilizando uno de los varios bootstrap intervalo de confianza de los métodos y de invertir el intervalo de confianza para obtener la prueba de hipótesis. O usted podría considerar la posibilidad de hacer la prueba de hipótesis directamente por el supuesto de la hipótesis nula con el bootstrap de distribución (esto implica centrar los datos como se describe en el documento de Sala y Wilson) y el cálculo de la probabilidad en la cola de la distribución bootstrap poco más allá de donde el original de la muestra de estimación. Que es el arranque de p-valor. Este es un enfoque mejor que el arranque de la prueba de la t de.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X