He encontrado un efecto extraño al calcular la eta al cuadrado en ANOVA. He aquí una breve simulación para demostrarlo.
Simulo $k$ grupos con $n=10$ cada uno, con todos los valores extraídos de una distribución normal estándar (es decir, bajo la hipótesis nula de no diferencia entre grupos). Realizo un ANOVA unidireccional para comparar estos grupos y calculo la eta al cuadrado $\eta^2 = \mathrm{SS}_\mathrm{btw}/\mathrm{SS}_\mathrm{tot}$ como medida del tamaño del efecto. A continuación, trazo el histograma de los valores resultantes a lo largo de muchas simulaciones. He aquí el gráfico de $k=2,5,10$ :
Se puede observar que mientras que en $k=2$ la distribución alcanza un máximo en cero, con más grupos la distribución empieza a alcanzar un máximo en un valor positivo distinto de cero. Tengo varias preguntas sobre este fenómeno.
-
He buscado un poco en Google (y en este foro) y he visto que eta al cuadrado suele denominarse una medida "sesgada" del tamaño del efecto. ¿Se refiere esto exactamente a lo que he encontrado?
Actualización: no. Como @gung y @Silverfish aclaran a continuación, eta al cuadrado está trivialmente sesgada porque está restringida a ser positiva, y por tanto $\mathbb{E}(\eta^2) \ne 0$ bajo el nulo, lo que significa que está sesgado por definición. Estoy hablando de un diferente fenómeno que no parece tener nombre (?), por lo que lo llamaré "modo-biased-under-null".
-
¿En qué condiciones aparece este modo-bias-under-null? No lo consigo con una prueba t ( $k=2$ ), tanto con tamaños de muestra iguales como no iguales, y parecen no conseguirlo con $k=3$ . ¿Qué es una condición (en términos de $k$ et $n_i$ ) que garantice que el modo estará a cero?
Actualización: parece que la respuesta es $k \le 3$ . Véase el debate aquí: ¿Cuál es la distribución de $R^2$ en regresión lineal bajo la hipótesis nula? ¿Por qué su moda no está en cero cuando $k>3$ ?
-
¿Cuáles son las alternativas a eta al cuadrado que no sufren de este extraño modo-biadness-under-null?
Me gustaría disponer de una medida del tamaño del efecto (informalmente: medida de "separabilidad" entre grupos) que:
es imparcialpuede estar sesgada, pero debería alcanzar un máximo de cero bajo la hipótesis nula;- está entre $0$ et $1$ para que $0$ puede interpretarse como un solapamiento total entre grupos y $1$ como distribuciones no superpuestas de grupos (es decir. $100\%$ precisión de clasificación mediante un algoritmo trivial);
- no tiene por qué venir dada por una fórmula sencilla, siempre que pueda calcularse (por ejemplo, para $k=2$ un área bajo una curva ROC sería una opción);
- funciona con grupos desequilibrados;
- se generaliza a ANOVA de n vías con varios factores, como eta al cuadrado se generaliza a eta al cuadrado parcial (pero no me interesa el anidamiento, las medidas repetidas u otros diseños ANOVA desagradables; sólo, por ejemplo, dos factores con una interacción).
Actualización: ¿por qué iba a importarme?
En mi campo (neurociencia), la gente a menudo prueba un montón de DVs (actividad de neuronas individuales) para la dependencia de algunos IVs categóricos. A menudo esto se hace cuando sólo hay un IV categórico de interés, y es binario. En este caso, se suele trazar un histograma de los tamaños del efecto en una población de neuronas. He aquí un ejemplo de este artículo de Nature :
Aquí $563$ neuronas, $136$ mostraron diferencias significativas en $p<0.05$ y el tamaño del efecto ("preferencia de resultado") se calculó como un área bajo la curva ROC a una escala adecuada.
Quiero hacer un histograma similar, pero cuando se comprueba la sintonía de las neuronas no con un factor binario, sino con un factor multinivel. Así que iba a ejecutar ANOVA y utilizar $\eta^2$ como el tamaño del efecto (o quizás con signo $\eta$ ya que mi factor es de hecho ordinal, por lo que se puede asignar un signo significativo a $\sqrt{\eta^2}$ ), pero el histograma resultante no tiene un pico en cero (y en el caso de signatura $\eta$ es bimodal), lo que sin duda confundirá a los todos los lectores.
2 votos
"es insesgado (picos en cero bajo la hipótesis nula)": Puede que me esté perdiendo algo aquí, pero relacionando esto de nuevo con la regresión múltiple, es casi imposible que $R^2 = 0$ incluso bajo $H_0$ . Tendrías que tener suerte con tu $X$ siendo ortogonal a lo observado $Y$ . Exigir que $\mathbb{E}(R^2) = 0$ bajo el nulo es obviamente un requisito irrazonable porque casi siempre va a ser positivo, pero nunca negativo (consideraciones similares pero no idénticas para $R^2_{adj}$ ). En $\rho^2$ es cero bajo el nulo, $R^2$ no es sorprendentemente parcial. Pero, ¿quizá se refiere a otra cosa con "tendencioso"?
0 votos
@Silverfish, no estoy muy familiarizado con este tema, así que es muy posible que mis preguntas sean ingenuas. Perdón por ello y gracias por comprender. Pero estoy confundido. ¿Es $\eta^2 = R^2$ va a llegar a cero para una prueba t? En caso afirmativo, ¿qué relación tiene con lo que has escrito? O tal vez debería estar pensando en $r$ y no sobre $r^2$ ? Espera, ¿entonces el problema es que para muchos grupos / muchos predictores no hay forma de "sacar una raíz cuadrada" de $R^2$ y asignarle un signo significativo?
0 votos
Me temo que cada vez que veo un ANOVA empiezo a pensar en una regresión. Los usuarios cuyos cerebros funcionan en "modo ANOVA" están mejor preparados que yo para responder a esta pregunta, pero $R^2$ et $\eta^2$ son estrechamente vinculados .
0 votos
Sí, creo $\eta^2$ es $R^2$ . Hablemos entonces de regresión; según tengo entendido, una prueba t corresponde a una regresión con un solo predictor. Es evidente que $r$ (coeficiente de correlación) alcanzará un máximo de cero bajo nulo. Pero ¿cuál será la moda de $r^2$ distribución bajo la nula? Si también es cero, entonces una parte de mi pregunta es: ¿por qué es diferente en la regresión múltiple? Tenga en cuenta que no estoy preguntando sobre $\mathbb{E}(R^2)$ Como ha escrito más arriba, pregunto por el modo.
1 votos
Cuando veo " $\hat{\theta}$ es tendencioso", creo que esto significa $\mathbb{E}(\hat{\theta})\neq\theta$ . En relación con $R^2$ como estimador del % de variación explicada en la población por el modelo correcto, o bien $R$ como estimador de la correlación entre los valores ajustados y observados en la población, el concepto de que son estimadores "sesgados" tiene sentido. Sin embargo, se refiere a la media, no a la moda (por eso me pregunto si estás buscando una palabra distinta de "sesgo") y es "obvio" que están sesgados si $H_0$ es cierto: como son positivos no pueden promediar a cero.
0 votos
Ya veo. Por supuesto, tiene razón sobre el significado de "tendencioso", ¡gracias por corregir esta confusión! No tengo ni idea de cuál podría ser el mejor término, llamémoslo "modo sesgado" por el momento. Así que mis preguntas sobre la regresión pasan a ser: ¿es $r^2$ con sesgo de modo para la regresión simple? es $R^2$ con sesgo de modo para la regresión múltiple? Si las respuestas a estas dos preguntas no son las mismas, ¿por qué?
0 votos
Espero que este debate le haya aclarado algunas cosas. Esto tiene la base para una muy buena pregunta, aunque le sugiero que edite para aclarar re sesgo. Probablemente debería preguntar sobre la distribución nula de $R^2$ como pregunta aparte - me sorprende que no se haya planteado aquí antes pero no lo veo. (La estadística F se puede escribir en términos de $R^2$ lo que nos da una pista). Esta simulación puede ser instructivo para usted.
0 votos
Voy a pensar en cómo editar esta pregunta, pero ya he publicado una pregunta separada como usted sugirió: ¿Cuál es la distribución de $R^2$ en regresión lineal bajo la hipótesis nula? . Espero que alguien responda rápidamente a esa pregunta y me ayude a editar ésta.
0 votos
Probablemente sepa que se espera que el R-cuadrado ajustado sea cero bajo el nulo
0 votos
@Michael: ¿de verdad? Llevo leyendo sobre ello desde ayer, y parece que R ajustada al cuadrado $\bar{R}^2$ utiliza estimaciones insesgadas de las varianzas de error y total (en lugar de las sesgadas que entran en $R^2$ ), pero la relación entre ellos seguirá siendo sesgada, haciendo que $\bar{R}^2$ sesgada también, aunque menos que $R^2$ . Sin embargo, lo más molesto de $\bar{R}^2$ es que puede ser negativo (y, por supuesto, tiene que serlo para ser siquiera aproximadamente imparcial). Estoy tratando de entender si tal vez puedo utilizar una cantidad sin nombre (?) $\mathrm{max}\{0, \bar{R}^2\}$ sin embargo.
0 votos
@amoeba: su expectativa es 0, no su modo. En cuanto piensas en la varianza explicada fuera de la muestra, los valores muestrales negativos cobran sentido de inmediato.