25 votos

¿Por qué la prueba de Levene de igualdad de varianzas en lugar de la razón F?

El SPSS utiliza la prueba de Levene para evaluar la homogeneidad de las varianzas en el procedimiento de la prueba t de grupos independientes.

¿Por qué la prueba de Levene es mejor que un simple cociente F de la relación de las varianzas de los dos grupos?

3 votos

37voto

Sean Hanley Puntos 2428

Usted podría utilizar una prueba F para evaluar la varianza de dos grupos, pero el uso de F para probar las diferencias de varianza requiere estrictamente que las distribuciones sean normales. El uso de la prueba de Levene (es decir, los valores absolutos de las desviaciones de la media) es más robusto, y el uso del Prueba Brown-Forsythe (es decir, los valores absolutos de las desviaciones del mediana ) es aún más robusto. SPSS está utilizando un buen enfoque aquí.

Actualización En respuesta al comentario de abajo, quiero aclarar lo que estoy tratando de decir aquí. La pregunta se refiere a la utilización de "una relación F simple del cociente de las varianzas de los dos grupos". A partir de esto, entendí que la alternativa era lo que a veces se conoce como La prueba de Hartley , que es un enfoque muy intuitivo para evaluar la heterogeneidad de la varianza. Aunque se utiliza una relación de varianzas, no es la misma que la utilizada en la prueba de Levene. Como a veces es difícil entender lo que se quiere decir cuando sólo se dice con palabras, daré ecuaciones para que quede más claro.

La prueba de Hartley: $$ F=\frac{s^2_2}{s^2_1} $$ Prueba de Levene / Prueba de Brown-Forsythe: $$ F=\frac{MS_{b/t-levels}}{MS_{w/i-levels}} $$

En los tres casos, tenemos relaciones de varianzas, pero las varianzas específicas utilizadas difieren entre ellas. Lo que hace que la prueba de Levene y la de Brown-Forsythe sean más robustas (y también distintas de cualquier otro ANOVA), es que se realizan sobre transformado datos, mientras que la relación F de las varianzas de los grupos (prueba de Hartley) utiliza los datos brutos. Los datos transformados en cuestión son los valores absolutos de las desviaciones (de la media, en el caso de la prueba de Levene, y de la mediana, en el caso de la prueba de Brown-Forsythe).

Hay otras pruebas de heterogeneidad de la varianza, pero me limito a ellas, ya que entendí que eran el objetivo de la pregunta original. El razonamiento para elegir entre ellas se basa en su rendimiento si los datos originales no son realmente normales; siendo la prueba F lo suficientemente poco robusta como para no recomendarla; siendo la prueba de Levene ligeramente más potente que BF si los datos son realmente normales, pero no bastante tan robustos si no lo son. La cita clave aquí es O'Brien (1981), aunque no he podido encontrar una versión disponible en Internet. Pido disculpas si he entendido mal la pregunta o no he sido claro.

2 votos

Dado que la estadística de Levene es un cociente de cuadrados construido a partir de esos residuos absolutos, y se remite a una distribución F, ¡no es inmediatamente evidente que deba ser más robusto que otras pruebas basadas en cocientes de cuadrados! Puede que esté pensando en variantes más robustas, como la Prueba Brown-Forsythe . Ver una buena discusión de @chl en stats.stackexchange.com/questions/2591/ .

0 votos

@whuber, gracias por el comentario y el enlace. Hay demasiado para responder en un comentario, así que he editado mi respuesta. Creo que lo que estoy tratando de llegar a debe ser más claro ahora. Sin embargo, si he entendido mal, o simplemente estoy equivocado, puedo borrar esta respuesta.

0 votos

El (nuevo) último párrafo aclara bien tu punto de vista (+1).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X