4 votos

¿Cómo puedo comprobar si la media extrapolada de un modelo de regresión difiere de la media observada?

Supongamos que el rendimiento de la tarea $y$ aumenta con el número de ensayos $x$ ( $x = 1, 2, …, 10$ ), por lo que existe un efecto de práctica. Supongamos que el efecto de la práctica es lineal. Los sujetos tienen un largo descanso, y luego proporcionan otra observación de $y$ (para $x = 11$ ).

Tengo razones para creer que los sujetos mejoran en la tarea durante esta pausa, más allá de lo que cabría esperar por el efecto de la práctica lineal. Por lo tanto, quiero comprobar si el rendimiento medio en el 11º ensayo se predice mediante un modelo lineal ajustado a los 10 primeros ensayos. ¿Cuál sería el procedimiento correcto para probar esta hipótesis? Imagino que sería algo así como

  1. Ajuste un modelo de regresión de y en x para x = 1,2, ,10.
  2. Calcule la media condicional dada $x = 11$ basado en el modelo y llamar a este $Y_m$ .
  3. Calcule la media muestral de $y$ para $x = 11$ y llamar a esto $Y_s$ .
  4. Comprueba la diferencia entre las dos cantidades anteriores.

Pero, ¿cómo puedo calcular el error estándar de la diferencia? ¿O debo calcular simplemente los intervalos de confianza para ambos $Y_m$ y $Y_s$ y ver si se superponen?

--

Actualización: ¿Puedo ajustar una regresión lineal a todos los ensayos $x = 1,2,...,11$ ¿Incluir una variable ficticia para el 11º ensayo y probar la significación del término de la variable ficticia?

2voto

Niall Puntos 51

Su "Actualización" es realmente muy inteligente, pero creo que la estimación de la pendiente estaría algo confundida con el efecto estimado de su variable ficticia. A veces estas cosas son difíciles de evitar, pero sugiero un enfoque ligeramente alterado que no tiene este problema. Podría ajustar un modelo:

$$ Y = \beta_{0} + X \beta_{1} + \epsilon $$

a todo el conjunto de datos, incluyendo el 11º punto de tiempo. Ahora dejemos que $X_{k}$ sea el $k$ 'el valor de "prueba" que utilizó para $X$ . También se podría ajustar el modelo

$$ Y = \alpha_{0} + X' \alpha_{1} + X_{11} \alpha_{2} + \varepsilon $$

donde $X_{k}' = X_{k}$ si $k \leq 10$ y 0 en caso contrario, y $X_{11} = X_{k}$ si $k = 11$ y 0 en caso contrario. Así, se tiene una pendiente general que rige los 10 primeros ensayos, y se permite que el 11º ensayo tenga el efecto que quiera. A continuación, compare los dos utilizando la prueba de razón de verosimilitud con 1 grado de libertad. Observe si $\alpha_{1}=\alpha_{2}$ entonces se llega de nuevo al modelo más pequeño, por lo que el modelo más pequeño es un submodelo, por lo que el LRT es apropiado aquí.

Si es significativo, esto indicaría que el segundo (y más grande) modelo, que permite que el 11º punto temporal tenga un efecto diferente, se ajusta mejor a los datos, lo que indica que utilizar la misma pendiente para ajustar el 11º valor predictor que hizo para los 10 primeros no es suficiente.

Nota: La TRL sólo es una herramienta válida aquí si los errores se distribuyen normalmente (suponiendo que se trata de una regresión OLS).

0voto

pauly Puntos 932

Zabrodsky lo hace en un artículo sobre mapas fantasma. No es functorial, pero se puede hacer de forma coherente para todos los espacios y mapas de un diagrama que sea finito (en el sentido apropiado).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X