13 votos

¿Qué pasó con significación estadística en regresión al tamaño de los datos es gigantesco?

Estaba leyendo esta pregunta con respecto a gran escala de regresión (enlace) donde whuber señaló un punto interesante de la siguiente manera:

"Casi cualquier prueba estadística de ejecutar será tan poderosa que es casi seguro que para identificar un "importante" efecto. Usted tiene que centrarse mucho más en la estadística de importancia, tales como el tamaño del efecto, en lugar de significación".

--- whuber

Me preguntaba si esto es algo que puede ser probado o simplemente algunos fenómenos comunes en la práctica?

Cualquier puntero a una prueba/discusión/simulación sería realmente útil.

10voto

AdamSane Puntos 1825

Es bastante general.

Imagino que hay una pequeña, pero no cero efecto (por ejemplo, una desviación de la nula de que la prueba es capaz de recoger).

EN tamaños de muestra pequeños, la posibilidad de rechazar va a ser muy de cerca el tipo de la tasa de error (ruido domina el pequeño efecto).

Como los tamaños de muestra crecer el efecto estimado deberían converger a la población en efecto, mientras que, al mismo tiempo, la incertidumbre de la estimación del efecto se reduce (normalmente como $\sqrt{n}$), hasta la posibilidad de que el null situación es lo suficientemente cerca como para que el efecto estimado que es plausible en una muestra al azar de la población reduce efectivamente cero.

Es decir, con el punto nulos, finalmente, el rechazo se convierte en certeza, porque en casi todas las situaciones reales que hay en esencia siempre va a ser cierta cantidad de la desviación de la anulación.

4voto

nic ferrier Puntos 183

Esto no es una prueba, pero no es difícil mostrar la influencia del tamaño de la muestra en la práctica. Me gustaría utilizar un ejemplo sencillo de Wilcox (2009), con cambios menores:

Imagino que una medida general de ansiedad, un investigador de reclamaciones que la población de estudiantes universitarios tiene una media de al menos 50. Como verificar esta afirmación, supongamos que diez de los estudiantes universitarios son al azar muestreados con el objetivo de las pruebas de $H_0: \mu \geq 50$$\alpha = .05$. (Wilcox, 2009: 143)

Podemos utilizar la prueba t para este análisis:

$$T = \frac{\bar X - \mu_o}{s/\sqrt{n}}$$

Suponiendo que la media de la muestra ($\bar X$) es de 45 y desviación estándar de la muestra ($s$) es de 11,

$$T = \frac{45-50}{11/\sqrt{10}}=-1.44.$$

Si usted mira una tabla que contiene los valores críticos de los Estudiantes de la $t$ distribución $ν$ grados de libertad, se verá que la de $v = 10 -1$, $P(T \leq - 1.83)= .05$. Así que con $T=-1.44$, no podemos rechazar la hipótesis nula. Ahora, supongamos que tenemos la misma muestra, la media y la desviación estándar, pero 100 observaciones vez:

$$T = \frac{45-50}{11/\sqrt{100}}= -4.55$$

Para $v = 100 - 1$, $P(T \leq -1.66) = .05$ , podemos rechazar la hipótesis nula. Manteniendo todo lo demás constante, aumentando el tamaño de la muestra, se disminuirá el denominador y lo más probable es que tenga los valores de la crítica (rechazo) de la región de la distribución de muestreo. Tenga en cuenta que $s/\sqrt{n}$ es una estimación del error estándar de la media. Así, se puede ver cómo una interpretación similar se aplica a, por ejemplo, las pruebas de hipótesis sobre los coeficientes de regresión obtenidos en la regresión lineal, donde la $T = \frac{\hat\beta_j-\beta_j^{(0)}}{se(\hat\beta_j)}$.


Wilcox, R. R., 2009. Estadísticas básicas: Comprensión de los Métodos Convencionales y Modernas Perspectivas. Oxford University Press, Oxford.

2voto

Zizzencs Puntos 1358

En regresión, el modelo general, la prueba está en f el. Aquí

$$ F = \frac{\frac{RSS_1-RSS_2}{p_2 - p_1}} {\frac {RSS_2} {n-p_2}} $$ donde RSS es suma residual de cuadrados y p es el número de parámetros. Pero, para esta pregunta, la clave es la N en el denominador más bajo. No importa cuán cerca $RSS_1$ es $RSS_2$, cuando N se hace más grande, F se hace más grande. Por lo tanto, sólo aumento N hasta el F es significativo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X