Creo que esta cuestión se debe a una confusión fundamental sobre cómo el paradigma Neyman-Pearson para pruebas estadísticas de hipótesis obras, pero una muy interesante. La analogía central que utilizaré para discutir esto es la idea de referencia absoluta vs. relativa en informática, que será más familiar para la gente a través de cómo se desarrolla en la escritura de funciones en Excel. (Hay una guía rápida sobre esto ici .) La idea es que algo puede estar fijado en una posición determinada en una escala absoluta, o sólo puede estar en una posición relativa a otra cosa; el resultado es que si la "otra cosa" cambia, la segunda también cambiará, pero la primera seguiría siendo la misma.
El concepto central de las pruebas de hipótesis, sobre el que se construye todo lo demás, es el de distribución del muestreo . Es decir, cómo una estadística de la muestra (como la pendiente de la muestra) rebotará si un estudio por lo demás idéntico se realiza una y otra vez ad infinitum. (Para más referencias, he hablado de esto ici et ici .) Para realizar una inferencia estadística es necesario conocer tres cosas sobre la distribución muestral: su forma, su media y su desviación estándar (denominada error estándar). Dados algunos supuestos estándar, si los errores se distribuyen normalmente, la distribución muestral de la pendiente de un modelo de regresión se distribuirá normalmente, centrada en el valor verdadero, con un SE=1√N−1√s2/Σ(xi−ˉx)2 . (Si la varianza residual, s2 se estima a partir de sus datos, la distribución muestral será tdf=N−(1+p) , donde N es el número de datos que tiene, y p es el número de variables predictoras).
En la versión de Neyman-Pearson de las pruebas de hipótesis, tenemos un valor de referencia, o nulo, para una estadística de la muestra, y un valor alternativo. Por ejemplo, cuando se evalúa la relación entre dos variables, el valor nulo de la pendiente suele ser 0, porque eso significaría que no hay relación entre las variables, lo que suele ser una posibilidad importante a descartar para nuestra comprensión teórica de un tema. El valor alternativo puede ser cualquier cosa, puede ser un valor postulado por alguna teoría, o puede ser el valor más pequeño que a alguien le interese desde un punto de vista práctico, o puede ser otra cosa. Digamos que las hipótesis nula y alternativa sobre el valor verdadero de la pendiente de la relación entre X et Y en la población son 0 y 1, respectivamente. Estos números se refieren a una escala absoluta: no importa lo que se elija para α , β / poder, N etc., seguirán siendo los mismos. Si estipulamos algunos valores ( α=.05 , s2=1 , Var(X)=1 , & N=10 ), podemos calcular algunas cosas como el aspecto de las distribuciones muestrales bajo las hipótesis nula y alternativa, o la potencia que tendría la prueba.
Ahora bien, ¿cómo debemos decidir si rechazamos la hipótesis nula en esta situación? Hay al menos dos maneras: Podríamos comprobar si nuestro valor p es inferior a α o simplemente comprobar si nuestra beta es mayor que el valor numérico absoluto que corresponde a esos números en esta situación. Lo fundamental es darse cuenta de que lo primero es relativa a la distribución muestral bajo la hipótesis nula, pero esta última es una posición absoluta en la recta numérica. Si volvemos a calcular las distribuciones muestrales, pero con N=25 En cuanto a los valores de la hipótesis nula, tendrían un aspecto diferente (es decir, tendrían desviaciones estándar más estrechas), pero esos valores definidos en relación con la distribución muestral de la hipótesis nula tendrían la misma relación con la prueba de la hipótesis nula, porque se definen así . Es decir, por ejemplo, el 2,5% superior de la distribución muestral nula seguiría comprendiendo el 2,5% del área total bajo la curva, pero esa línea se habría movido en relación con la escala numérica absoluta que hay debajo. Por otra parte, si sólo rechazamos la nulidad si nuestra beta estimada es mayor que el valor que hemos calculado anteriormente, cada vez sería menos probable rechazar la nulidad si mantenemos ese valor y aumentamos continuamente N .
Considere la siguiente figura. El umbral alfa se define como el punto que delimita el 5% más exterior del área bajo la curva (aquí he mostrado sólo la cola superior, la cola inferior funcionaría igual). Cuando N=10 Esto cae en X=.735 (dados los valores que hemos estipulado anteriormente). Cuando N aumenta a 25 el error estándar se reduce y la distribución muestral se hace más "estrecha". Como α=.05 se define en relación con la distribución de muestreo, se desplaza junto con el resto de la distribución de muestreo. El valor correspondiente de la pendiente de la muestra se convierte en .417 . Si el umbral se hubiera mantenido en el mismo lugar en la escala absoluta ( .735 ), la tasa de falsos positivos habría descendido a .00056 .
![enter image description here]()
Tenga en cuenta que este último enfoque de las pruebas de hipótesis, el de comparar el valor real observado de la pendiente de la muestra con un punto de corte fijo, no es en absoluto la forma en que se realizan las pruebas de hipótesis, pero creo que ésta es la base de su confusión.