¿Puedes dar la razón por la que se utiliza una prueba de una cola en la prueba de análisis de varianza?
¿Por qué usamos una prueba de una cola, la prueba F, en ANOVA?
¿Puedes dar la razón por la que se utiliza una prueba de una cola en la prueba de análisis de varianza?
¿Por qué usamos una prueba de una cola, la prueba F, en ANOVA?
Las pruebas F se utilizan más comúnmente con fines:
en ANOVA, para probar la igualdad de medias (y varios análisis similares); y
en la prueba de igualdad de varianzas
Consideremos cada uno por separado:
1) Las pruebas F en ANOVA (y de manera similar, los tipos habituales de pruebas de chi-cuadrado para datos de recuento) están construidas de tal manera que cuanto más consistentes son los datos con la hipótesis alternativa, mayor tiende a ser la estadística de prueba, mientras que arreglos de datos de muestra que parecen más consistentes con la hipótesis nula corresponden a los valores más pequeños de la estadística de prueba.
Considera tres muestras (de tamaño 10, con varianza de muestra igual), y organízalas de manera que tengan medias de muestra iguales, y luego mueve sus medias en diferentes patrones. A medida que la variación en las medias de muestra aumenta desde cero, la estadística F se vuelve más grande:
Las líneas negras ($^{\:_|}$) son los valores de los datos. Las líneas rojas gruesas ($\color{red}{\mathbf{|}}$) son las medias de grupo.
Si la hipótesis nula (igualdad de medias poblacionales) fuera cierta, esperarías alguna variación en las medias de muestra, y típicamente esperarías ver razones F alrededor de 1. Las estadísticas F más pequeñas resultan de muestras que están más juntas de lo que típicamente esperarías ... por lo que no concluirías que las medias poblacionales difieren.
Es decir, para ANOVA, rechazarás la hipótesis de igualdad de medias cuando obtengas valores de F inusualmente grandes y no rechazarás la hipótesis de igualdad de medias cuando obtengas valores inusualmente pequeños (puede indicar algo, pero no que las medias poblacionales difieren).
Aquí tienes una ilustración que podría ayudarte a ver que solo queremos rechazar cuando F esté en su cola superior:
2) Pruebas F para la igualdad de varianza* (basadas en las razones de varianza). Aquí, la razón entre dos estimaciones de varianza de muestra será grande si la varianza de muestra del numerador es mucho mayor que la varianza en el denominador, y la razón será pequeña si la varianza de muestra del denominador es mucho mayor que la varianza en el numerador.
Es decir, para probar si la razón de las varianzas poblacionales difiere de 1, querrás rechazar la hipótesis nula tanto para valores grandes como pequeños de F.
* (Dejando de lado el problema de la alta sensibilidad a la suposición de distribución de esta prueba (hay mejores alternativas) y también el problema de que si estás interesado en la idoneidad de las suposiciones de igualdad de varianzas de ANOVA, probablemente tu mejor estrategia no sea una prueba formal.)
Buena respuesta. Me pregunto qué prueba considerarías como una mejor alternativa para probar varianzas iguales (en general).
@TaylerJones La prueba de Levene es algo más robusta. Browne-Forsythe es más robusta (pero pierde un poco de poder cerca de lo normal). Fligner-Killeen aún más. En varias décadas, he utilizado Levene o Browne-Forsythe no más de dos veces cada una. (Si surgiera de nuevo, probablemente algo como Browne-Forsythe me vendría bien, pero generalmente no tengo situaciones en las que tenga sentido probar la igualdad de varianzas de varios grupos).
Pido disculpas. Aún no he entendido por qué usamos la prueba de una cola en ANOVA. Más específicamente, de su discusión entendí que bajo la hipótesis nula no tendría ningún efecto del tratamiento y consecuentemente $F=\frac{MS_{TRATAMIENTO}}{MS_{ERROR}}$ estará cerca de $1$, mientras que si la hipótesis alternativa es verdadera, el ratio $F$ será mayor. Pero, ¿cómo implica esto "que es la razón para usar una prueba de una cola en ANOVA?"
Debe entenderse que el objetivo del ANOVA es verificar si hay desigualdad de medias... lo que implica que nos preocupa las grandes variaciones entre las muestras (y, por lo tanto, las medias, ya que las variaciones se calculan a partir de las medias) en comparación con las variaciones dentro de las muestras (también calculadas a partir de la media individual de la muestra). Cuando las variaciones entre las muestras son pequeñas (lo que resulta en que el valor F esté del lado izquierdo), no importa ya que esta diferencia es insignificante. La variación entre las muestras es relevante si es significativamente mayor que las variaciones dentro y, en tal caso, el valor F sería mayor que 1 y, por lo tanto, estaría en la cola derecha.
La única pregunta que queda es por qué se coloca todo el nivel de significancia en la cola derecha y la respuesta es nuevamente similar. La rejección solo sucede cuando el ratio F está en el lado derecho y nunca cuando está en el lado izquierdo. El nivel de significancia es la medida del error debido a las limitaciones estadísticas. Como la rejección solo ocurre a la derecha, todo el nivel de significancia (riesgo de error de concluir incorrectamente) se mantiene en la derecha.
El valor esperado para el Cuadrado Medio (MS) dentro de los tratamientos es la varianza de la población, mientras que el valor esperado para el MS entre tratamientos es la varianza de la población MÁS la varianza del tratamiento. Por lo tanto, la razón de F = MSentre / MSdentro siempre es mayor que 1, y nunca menor que 1.
Dado que la precisión de una prueba de 1 cola es mejor que una prueba de 2 colas, preferimos usar la prueba de 1 cola.
No creo que la afirmación de la última oración de tu primer párrafo sea correcta... E(numerador) > E(denominador) no implica que el numerador sea mayor que el denominador.
Aparte del punto de Glen_b, no estoy seguro acerca de "ya que la precisión de una prueba de una cola es mejor que una prueba de dos colas, preferimos usar la prueba de una cola". ¿Puedes explicar a qué te refieres con esto? Hablar de precisión me parece que se pierde el punto.
La precisión es igual al intervalo de confianza a la mitad. Para la misma F-estadística, una prueba de una cola rechazará la hipótesis nula con un valor p más pequeño (la mitad, de hecho). De forma inversa, una prueba de una cola puede rechazar la hipótesis nula con valores más pequeños de la F-estadística. Esto implica que una prueba de una cola puede detectar un efecto de tratamiento con menos muestras o con más varianza de causa común presente en la muestra. Esto hace que la prueba de una cola sea más deseable, si se está buscando un efecto.
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.
3 votos
Algunas preguntas para guiar tu pensamiento... ¿Qué significa una t estadística muy negativa? ¿Es posible un estadístico F negativo? ¿Qué significa un estadístico F muy bajo? ¿Qué significa un estadístico F alto?
0 votos
¿Por qué tienes la impresión de que una prueba de una cola tiene que ser una prueba F? Para responder a tu pregunta: La prueba F permite probar una hipótesis con más de una combinación lineal de parámetros.
1 votos
¿Quieres saber por qué alguien utilizaría una prueba de una cola en lugar de una prueba de dos colas?
0 votos
@árbol ¿Qué constituye una fuente creíble u oficial para tus propósitos?
0 votos
@tree Por cierto, una explicación del por qué ya se da en el último párrafo de esta respuesta. Ampliaría esa respuesta en detalle, pero dudo que cumpla con tus criterios de 'creíble u oficial', sea lo que sea eso.
0 votos
@Glen_b Supongamos que mi hipótesis alternativa es $H_a:\sigma^2\ne0$. ¿Y en ese caso, no está la región de rechazo tanto en la cola derecha como en la
izquierda
? Estoy haciendo la pregunta de acuerdo a tu referencia en el último comentario.1 votos
@tree tenga en cuenta que la pregunta de Cynderella aquí no es _sobre una prueba de varianzas, sino específicamente una prueba F de ANOVA - que es una prueba de igualdad de medias. Si está interesado en pruebas de igualdad de varianzas, eso se ha discutido en muchas otras preguntas en este sitio. (Para la prueba de varianza, sí, le importan ambos extremos, como se explica claramente en la última oración de esta sección, justo encima de ' Propiedades ')_
0 votos
En cualquier caso, puedes rechazar el nulo que especificaste allí tan pronto como tu muestra tenga varianza distinta de cero, ya que si la muestra tiene varianza distinta de cero, la población también debe. Sospecho que quisiste escribir algo diferente ahí.
0 votos
Tal vez esto pueda ayudar: stats.stackexchange.com/questions/171074/…