Como estoy empezando con las pruebas de permutación, pensé que una pregunta era una buena idea. De hecho, gracias a los comentarios de @Glen_b y @usuario43849 , percibí muchos malentendidos e incoherencias de la teoría por mi parte. Por un lado, estaba pensando en probar la magnitud del coeficiente en lugar del efecto, que es lo que realmente interesa.
Así que, como estoy aprendiendo, una respuesta real para ser criticada sonaba igual de bien.
Para responder a esta pregunta y designar una estrategia de permutación que cumpla mis requisitos, he recurrido a Anderson MJ, Legendre P. "Una comparación empírica de métodos de permutación para pruebas de coeficientes de regresión parcial en un modelo lineal". Journal of statistical computation and simulation 62.3 (1999): 271-303 .
Allí, los autores hacen comparaciones empíricas entre cuatro estrategias de permutación, además de la teoría normal $t$ -pruebas estadísticas:
- Permutación de datos brutos (Manly, 1991, 1997)
- Permutación de los residuos en el modelo reducido (Freedman y Lane, 1983)
- Permutación de los residuos según el modelo reducido (Kennedy, 1995)
- Permutación de los residuos en el modelo completo (ter Braak, 1990, 1992)
Aquí citaré la descripción dada a la estrategia planteada por Manly. Dado un modelo $Y=\mu+\beta_{1\cdot2}X+\beta_{2\cdot1}Z+\epsilon$ :
- La variable Y se hace una regresión sobre X y Z conjuntamente (utilizando mínimos cuadrados) para obtener una estimación $b_{2\cdot 1}$ de $\beta_{2\cdot 1}$ y un valor del habitual $t$ -Estadística, $t_\text{ref}$ para las pruebas $\beta_{2\cdot 1}=0$ para los datos reales. En lo sucesivo nos referiremos a esto como el valor de referencia de $t$
- Los valores Y se permutan aleatoriamente para obtener los valores permutados Y*.
- Los valores de Y* se regresan sobre X y Z (sin atenuar) juntos para obtener una estimación $b_{2\cdot 1}^*$ de $\beta_{2\cdot 1}$ y un valor de $t^*$ para los datos permutados.
- Los pasos 2 y 3 se repiten un gran número de veces, obteniendo una distribución de valores de $t^*$ bajo permutación.
- El valor absoluto del valor de referencia $t_\text{ref}$ se sitúa en la distribución de los valores absolutos de $t^*$ obtenido bajo permutación (para una cola doble $t$ -prueba). La probabilidad se calcula como la proporción de valores de esta distribución mayores o iguales, en valor absoluto, a igual, en valor absoluto, al valor absoluto de $t_\text{ref}$ (Esperanza, 1968)
Así, esta estrategia conserva la covarianza de las variables independientes X y Z. Otros métodos se centran en la comprobación de los coeficientes parciales de forma aislada, y se discuten en el texto. Asimismo, tanto en el texto como en la bibliografía se exponen los posibles inconvenientes de la estrategia de permutación de los datos brutos.
0 votos
No estoy seguro de entender esto; ¿qué estadística sería intercambiable bajo el nulo aquí?
0 votos
@Glen_b Perdón por la falta de claridad, estoy aprendiendo a manejar esto. Tentativamente: Estoy probando la magnitud de los coeficientes del modelo, por lo que bajo el nulo que sería intercambiable supongo? (¿O no estoy entendiendo lo que significa intercambiabilidad aquí?)
0 votos
Lo siento, me he levantado muchas horas después de acostarme, no lo he expresado correctamente (he utilizado mal "estadística"; debería haberme referido a algo relacionado con las observaciones individuales). Cuando se hace una prueba de permutación, hay que permutar algo. ¿Qué se permuta?
1 votos
@Glen_b ¡Sin problemas! Estoy permutando las instancias de dicha variable. Entonces, la hipótesis nula es que el efecto es cero, permutar las entradas no cambiaría significativamente la magnitud del efecto. Todavía es un poco pronto jaja
0 votos
A continuación, comparo la magnitud del coeficiente sin permutaciones con la magnitud de los coeficientes remuestreados, obteniendo un valor p a partir de la proporción que alcanzó una magnitud mayor que la primera, no permutada.
0 votos
¿Puede aclarar lo que quiere decir con "permutar las entradas"? Imagina que permutaras algo entre $i$ y $j$ Observaciones. ¿Está cambiando el $y_i$ y $y_j$ pero manteniendo todos los elementos de $x_i$ ¿Juntos? ¿Intercambias también algunos elementos de las variables x? ¿Está intercambiando residuos ?
0 votos
@Glen_b Para probar el coeficiente asociado al IV $x$ Cambiaría $x_i$ y $x_j$ el resto seguiría igual.
0 votos
No estoy seguro de que funcione como esperas. ¿Cuál es la nula y la alternativa?
0 votos
@Glen_b $H_0: \beta_{A \times B} = 0$ , $H_1: \beta_{A \times B} \neq 0$ . El procedimiento que describo está estrechamente relacionado con Konczak, G. (2012). Prueba de la significación de los coeficientes en el análisis de regresión múltiple . Acta Universitatis Lodziensis. Folia Oeconomica.
2 votos
Yo no prestaría mucha atención a ese artículo, que por lo que veo ni siquiera proporciona una descripción adecuada del método de permutación empleado. Aquí hay uno mejor: avesbiodiv.mncn.csic.es/estadistica/permut2.pdf
0 votos
@user43849 Como dije (al principio de la larga conversación jaja) esta vez estoy aprendiendo el oficio. ¡Gracias por la referencia!
0 votos
Una aclaración rápida: ¿le interesa principalmente probar la significación del término de interacción o la significación del efecto principal? En este último caso, antes de adentrarte demasiado en esta madriguera de permutaciones, podrías preguntarte si realmente te importa la significación del efecto principal en presencia de la interacción. Me doy cuenta de que puede que no sea un consejo útil en este momento, así que tómelo FWIW.
0 votos
@user43849 Me interesa sobre todo la importancia de un único efecto principal. Los demás efectos son en su mayoría molestias conocidas para mi aplicación.
0 votos
¿Por qué dio un nulo y una alternativa sobre la interacción si está interesado principalmente en el efecto principal?
0 votos
@Glen_b Yo también quiero probarlo, también es parte de la pregunta.