8 votos

¿Cómo hacer la prueba de permutación de los coeficientes del modelo cuando se incluye un término de interacción?

Dado el siguiente modelo como ejemplo:

$$Y=\beta_0+\beta_A\cdot A+\beta_B\cdot B+\beta_{AB}\cdot A \cdot B+\epsilon$$

En notación alternativa:

$$Y\sim A + B + A: B$$

La cuestión principal:

Al permutar las entradas de la variable $A$ para comprobar su coeficiente ( $\beta_A$ ) en un modelo, debería incluirse un término de interacción como $B\cdot A$ ¿también se vuelve a calcular?

Pregunta secundaria:

¿Y qué hay de las pruebas de $B\cdot A$ coeficiente del término de interacción ( $\beta_{AB}$ )? ¿Se calculan sus permutaciones independientemente de las variables $A$ y $B$ ?

Un poco de contexto:

Quiero realizar una prueba sobre los coeficientes de un modelo (es un análisis de correlación canónica, pero la pregunta es aplicable a cualquier modelo lineal que incluya interacciones).

Estoy probando mis manos con las pruebas de permutación. Mientras que es bastante sencillo probar la correlación canónica en sí, cómo hacer lo mismo con las puntuaciones de las variables, o coeficientes, es un poco confuso para mí cuando se incluye un término de interacción.

He leído ¿Cómo probar un efecto de interacción con una prueba no paramétrica (por ejemplo, una prueba de permutación)? pero mi pregunta es mucho más práctica.

0 votos

No estoy seguro de entender esto; ¿qué estadística sería intercambiable bajo el nulo aquí?

0 votos

@Glen_b Perdón por la falta de claridad, estoy aprendiendo a manejar esto. Tentativamente: Estoy probando la magnitud de los coeficientes del modelo, por lo que bajo el nulo que sería intercambiable supongo? (¿O no estoy entendiendo lo que significa intercambiabilidad aquí?)

0 votos

Lo siento, me he levantado muchas horas después de acostarme, no lo he expresado correctamente (he utilizado mal "estadística"; debería haberme referido a algo relacionado con las observaciones individuales). Cuando se hace una prueba de permutación, hay que permutar algo. ¿Qué se permuta?

4voto

ssn Puntos 472

Como estoy empezando con las pruebas de permutación, pensé que una pregunta era una buena idea. De hecho, gracias a los comentarios de @Glen_b y @usuario43849 , percibí muchos malentendidos e incoherencias de la teoría por mi parte. Por un lado, estaba pensando en probar la magnitud del coeficiente en lugar del efecto, que es lo que realmente interesa.

Así que, como estoy aprendiendo, una respuesta real para ser criticada sonaba igual de bien.


Para responder a esta pregunta y designar una estrategia de permutación que cumpla mis requisitos, he recurrido a Anderson MJ, Legendre P. "Una comparación empírica de métodos de permutación para pruebas de coeficientes de regresión parcial en un modelo lineal". Journal of statistical computation and simulation 62.3 (1999): 271-303 .

Allí, los autores hacen comparaciones empíricas entre cuatro estrategias de permutación, además de la teoría normal $t$ -pruebas estadísticas:

  1. Permutación de datos brutos (Manly, 1991, 1997)
  2. Permutación de los residuos en el modelo reducido (Freedman y Lane, 1983)
  3. Permutación de los residuos según el modelo reducido (Kennedy, 1995)
  4. Permutación de los residuos en el modelo completo (ter Braak, 1990, 1992)

Aquí citaré la descripción dada a la estrategia planteada por Manly. Dado un modelo $Y=\mu+\beta_{1\cdot2}X+\beta_{2\cdot1}Z+\epsilon$ :

  1. La variable Y se hace una regresión sobre X y Z conjuntamente (utilizando mínimos cuadrados) para obtener una estimación $b_{2\cdot 1}$ de $\beta_{2\cdot 1}$ y un valor del habitual $t$ -Estadística, $t_\text{ref}$ para las pruebas $\beta_{2\cdot 1}=0$ para los datos reales. En lo sucesivo nos referiremos a esto como el valor de referencia de $t$
  2. Los valores Y se permutan aleatoriamente para obtener los valores permutados Y*.
  3. Los valores de Y* se regresan sobre X y Z (sin atenuar) juntos para obtener una estimación $b_{2\cdot 1}^*$ de $\beta_{2\cdot 1}$ y un valor de $t^*$ para los datos permutados.
  4. Los pasos 2 y 3 se repiten un gran número de veces, obteniendo una distribución de valores de $t^*$ bajo permutación.
  5. El valor absoluto del valor de referencia $t_\text{ref}$ se sitúa en la distribución de los valores absolutos de $t^*$ obtenido bajo permutación (para una cola doble $t$ -prueba). La probabilidad se calcula como la proporción de valores de esta distribución mayores o iguales, en valor absoluto, a igual, en valor absoluto, al valor absoluto de $t_\text{ref}$ (Esperanza, 1968)

Así, esta estrategia conserva la covarianza de las variables independientes X y Z. Otros métodos se centran en la comprobación de los coeficientes parciales de forma aislada, y se discuten en el texto. Asimismo, tanto en el texto como en la bibliografía se exponen los posibles inconvenientes de la estrategia de permutación de los datos brutos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X