41 votos

¿Cómo probar la hipótesis de que no hay diferencias de grupo?

Imagínese que tiene un estudio con dos grupos (por ejemplo, hombres y mujeres) que analizan una variable dependiente numérica (por ejemplo, las puntuaciones del test de inteligencia) y tiene la hipótesis de que no hay diferencias entre los grupos.

Pregunta:

  • ¿Cuál es una buena manera de comprobar si no hay diferencias de grupo?
  • ¿Cómo determinaría el tamaño de la muestra necesario para comprobar adecuadamente que no hay diferencias entre los grupos?

Pensamientos iniciales:

  • No bastaría con hacer una prueba t estándar, ya que el hecho de no rechazar la hipótesis nula no significa que el parámetro de interés sea igual o cercano a cero; esto ocurre especialmente con muestras pequeñas.
  • Podría mirar el intervalo de confianza del 95% y comprobar que todos los valores están dentro de un rango suficientemente pequeño; quizás más o menos 0,3 desviaciones estándar.

21voto

palmsey Puntos 3799

Creo que está preguntando por pruebas de equivalencia . Esencialmente, hay que decidir qué tamaño de diferencia es aceptable para seguir concluyendo que los dos grupos son efectivamente equivalentes. Esta decisión define los límites del intervalo de confianza del 95% (o de otro tipo), y los cálculos del tamaño de la muestra se realizan sobre esta base.

Hay un todo el libro sobre el tema.

Un "equivalente" clínico muy común de las pruebas de equivalencia es un prueba/ensayo de no inferioridad . En este caso, usted "prefiere" un grupo sobre el otro (un tratamiento establecido) y diseña su prueba para demostrar que el nuevo tratamiento no es inferior al tratamiento establecido con cierto nivel de evidencia estadística.

Creo que tengo que acreditar Harvey Motulsky para el GraphPad.com sitio (bajo "Biblioteca" ).

17voto

Anthony Cramp Puntos 126

Además de la posibilidad ya mencionada de algún tipo de prueba de equivalencia De los cuales la mayoría, hasta donde yo sé, están enrutados en la buena y vieja tradición frecuentista, existe la posibilidad de realizar pruebas que realmente proporcionen una cuantificación de la evidencia a favor de una hipótesis nula, a saber pruebas bayesianas .

Se puede encontrar una implementación de una prueba t bayesiana aquí: Wetzels, R., Raaijmakers, J. G. W., Jakab, E., & Wagenmakers, E.-J. (2009). Cómo cuantificar el apoyo a favor y en contra de la hipótesis nula: Una implementación flexible en WinBUGS de una prueba t bayesiana por defecto. Psychonomic Bulletin & Review, 16, 752-760.

También hay un tutorial sobre cómo hacer todo esto en R:

http://www.ruudwetzels.com/index.php?src=SDtest


Un enfoque alternativo (quizás más moderno) de una prueba t bayesiana se proporciona (con código) en este documento de Kruschke:

Kruschke, J. K. (2013). La estimación bayesiana sustituye a la prueba t . Revista de Psicología Experimental: General , 142(2), 573-603. doi:10.1037/a0029146


Todos los apoyos para esta respuesta (antes de la adición de Kruschke) deben ir a mi colega David Kellen. He robado su respuesta de esta pregunta .

14voto

Eric Davis Puntos 1542

Tras la respuesta de Thylacoleo, he investigado un poco.

El equivalencia en R tiene el paquete tost() función.

Véase Robinson y Frose (2004) " Validación del modelo mediante pruebas de equivalencia " para más información.

8voto

Anthony Cramp Puntos 126

8voto

Ηλίας Puntos 109

Recientemente he pensado en una forma alternativa de "prueba de equivalencia" basada en una distancia entre los dos distribuciones y no entre sus medios.

Existen algunos métodos que proporcionan intervalos de confianza para la solapamiento de dos distribuciones gaussianas: enter image description here

El solapamiento $O(P_1,P_2)$ de (¿entre?) dos distribuciones $P_1$ y $P_2$ tiene una buena interpretación probabilística: $$1-O(P_1,P_2)= TV(P_1,P_2)$$ donde $TV(P_1,P_2) = \sup_A \big|P_1(A) - P_2(A) \big|$ es el distancia de variación total entre $P_1$ y $P_2$ .

Esto significa que, por ejemplo, si $O(P_1,P_2)>0.9$ entonces las probabilidades dadas por $P_1$ y $P_2$ de cualquier evento no difieren más que $0.1$ . A grandes rasgos, las dos distribuciones hacen las mismas predicciones hasta $10\%$ .

Así, en lugar de utilizar un criterio de aceptación basado en un valor crítico para la diferencia entre las medias $\mu_1$ y $\mu_2$ como en las pruebas de equivalencia clásicas, podríamos basarnos en un valor crítico para la diferencia entre el probabilidades de las predicciones dadas por las dos distribuciones.

Creo que hay una ventaja en cuanto a la "objetividad" del criterio. El valor crítico de $|\mu_1 - \mu_2|$ debe ser dado por un experto del problema real: debe ser un valor a partir del cual la diferencia tenga una importancia práctica. Pero a veces nadie tiene un conocimiento sólido sobre el problema real y no hay ningún experto capaz de proporcionar un valor crítico. Adoptando un valor crítico convencional sobre $TV(P_1,P_2)$ podría ser un camino hacia un criterio no dependiente del problema físico considerado.

En el caso gaussiano con las mismas varianzas, el solapamiento está relacionado uno a uno con la diferencia de medias estandarizada $\frac{|\mu_1-\mu_2|}{\sigma}$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X