24 votos

Tras el análisis de regresión bootstrapping, todos los valores p son múltiplos de 0,001996

Estoy ejecutando varios análisis de regresión múltiple en SPSS 27, y con los que no se han sometido a bootstrap, los valores p varían de tal forma que no encuentro el mismo valor p dos veces dentro de una regresión (por ejemplo, los valores p serán 0,000012435, 0,0053868, 0,000000013845, etc.). Sin embargo, he realizado un bootstrap de algunas de estas regresiones (bca, 500 muestras) y todos los valores p que aparecen en la tabla que indica los resultados del bootstrap son múltiplos de 0,001996 (por ejemplo, 0,001996, 0,003992, 0,007984). ¿Se trata de valores p legítimos? ¿O se trata de un error de SPSS? En cualquier caso, ¿son estos valores p "notificables" o debería utilizar los valores p de los resultados de regresión sin bootstrapped?

47voto

Johnny Puntos 151

Suponga que tiene una estimación del coeficiente de regresión de 1,2. Para calcular su valor p, necesita conocer la probabilidad de observar un coeficiente tan grande (o mayor) bajo la hipótesis nula. Para ello, debe conocer la distribución nula de este coeficiente. El remuestreo bootstrap es una forma de estimar esta distribución nula. Para una regresión, a través de sus 500 muestras bootstrap, va a obtener una distribución de coeficientes de regresión con una media que estará cerca de 1,2. Supongamos que la media de la regresión es 1,2. Digamos que la media de los coeficientes muestreados por bootstrap es 1,19. Digamos también que su hipótesis nula es que el valor verdadero del coeficiente es 0. Esto significa que la distribución nula de este coeficiente debería tener una media de 0. Podemos hacer que nuestros 500 coeficientes muestreados por bootstrap tengan una media de 0 simplemente restando su media actual de 1,19. Esto nos permite ahora utilizar la media de los coeficientes muestreados por bootstrap. Esto nos permite ahora utilizar la distribución bootstrap como estimación de la distribución nula.

A continuación, para calcular un valor p (de dos colas), podemos simplemente calcular la proporción de nuestros 500 coeficientes desplazados cuyo valor absoluto es mayor que el valor observado de 1,2. Por ejemplo, si 6 de ellos son mayores, obtendremos un valor p de 6/500 = 0,012. Tenga en cuenta que cualquier valor p que calculemos de esta forma siempre será un número entero dividido por 500. Por lo tanto, los únicos valores p que se pueden calcular de esta forma son los valores absolutos. Así que los únicos valores p que pueden salir de este cálculo son los valores que son un múltiplo entero de 0,002, es decir, 1/500.

Los valores que obtuviste no eran múltiplos de 0,002, sino de 0,001996. Esto resulta ser exactamente igual a 1/501. La razón de esta discrepancia de 1 es que el valor p "normal" calculado a partir de un bootstrap tiene un sesgo. La fórmula normal es $\hat{p}=\frac{x}{N}$ donde $x$ es el número de coeficientes muestreados por bootstrap que eran mayores que su valor observado, y $N$ es el número de muestras bootstrap. La fórmula con corrección de sesgo es $\hat{p}=\frac{x+1}{N+1}$ . Por lo tanto, cualquier valor p resultante de esta fórmula será un múltiplo entero de $\frac{1}{N+1}$ que en tu caso es 1/501.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X