21 votos

Si se "planifican" las comparaciones múltiples, ¿es necesario corregirlas?

Estoy revisando un trabajo que ha realizado >15 pruebas de Chi Cuadrado 2x2 distintas. Les he sugerido que deben corregir las comparaciones múltiples, pero me han contestado diciendo que todas las comparaciones estaban planificadas y que, por lo tanto, esto no es necesario.

Me parece que esto no debe ser correcto, pero no encuentro ningún recurso que diga explícitamente si es así.

¿Alguien puede ayudar con esto?


Actualización:

Gracias por todas sus respuestas tan útiles. En respuesta a la petición de @gung de algo más de información sobre el estudio y los análisis, están comparando los datos de recuento para dos tipos de participantes (estudiantes, no estudiantes) en dos condiciones, a través de tres períodos de tiempo. Las pruebas múltiples de Chi Cuadrado 2x2 están comparando cada período de tiempo, en cada condición, para cada tipo de participante (si eso tiene sentido; por ejemplo, estudiantes, condición 1, período de tiempo 1 vs. período de tiempo 2), por lo que todos los análisis están probando la misma hipótesis.

2 votos

Muchas personas que realizan múltiples comparaciones planean hacerlas todas a priori . Lo hacen porque quieren controlar la tasa global de error de tipo I. En algunas situaciones puede ser razonable no corregir las comparaciones múltiples, pero no se trata sólo de planear hacerlas todas desde el principio.

3 votos

¿Puede decirnos algo más sobre el estudio, sus datos y sus análisis? ¿Los >15 equivalen a todo posibles comparaciones, o sólo un pequeño %? ¿Cuántos datos tienen? ¿Cómo de plausible es que las hipótesis fueran todas a priori? ¿Son todas significativas? ¿Son las pruebas de chi-cuadrado independientes entre sí? Considere también algunas de las cuestiones planteadas en la respuesta de @peuhp.

4 votos

Dado que "ellos" probablemente estén interesados en encontrar resultados significativos, su respuesta es interesada. Por lo tanto, la carga de demostrar por qué su enfoque es legítimo recae en ellos, en lugar de que tú demuestres que es ilegítimo. Cualquier intento de demostrar que las correcciones de las comparaciones múltiples pueden ser ignoradas fracasará tan pronto como se considere la tasa de falsos positivos en todo el papel, y por lo tanto "ellos" deben evitar (deshonestamente) toda consideración de esa cuestión o bien proporcionar un buen argumento sobre por qué no es de interés para su público objetivo.

24voto

peuhp Puntos 788

En mi opinión, se trata de una cuestión compleja y me gustaría hacer tres comentarios sobre esta situación.

En primer lugar, y de forma general, yo me centraría más en si te enfrentas a un estudio confirmatorio con un conjunto de hipótesis bien formuladas y definidas en un contexto argumentativo o a un estudio explicativo en el que se observan muchos indicadores probables que en si están planificados o no (porque simplemente puedes planificar hacer todas las comparaciones posibles).

En segundo lugar, también me centraría en cómo se discuten los valores p resultantes. ¿Se utilizan individualmente para servir a un conjunto de conclusiones definitivas, o se discuten conjuntamente como evidencia y falta de evidencia?

Por último, me gustaría discutir la posibilidad de que las >15 hipótesis resultantes de las >15 pruebas de chi-cuadrado separadas sean en realidad la expresión de unas pocas hipótesis (tal vez una sola) que puedan resumirse.

En términos más generales, independientemente de si las hipótesis están preespecificadas o no, corregir o no las comparaciones múltiples es una cuestión de lo que se incluye en el error de tipo I. Al no corregir por MC, sólo se mantiene un control de la tasa de error de tipo I por comparación. Por lo tanto, en el caso de numerosas comparaciones, usted tiene una tasa de error de tipo I alta por familia y, por lo tanto, es más propenso a los falsos descubrimientos.

8 votos

(+1) Conviene precisar que la tasa de error del experimento no está controlada por las quince comparaciones individuales previstas; por otra parte, las posibles comparaciones más allá de las quince no previstas en el protocolo no deben tenerse en cuenta en la corrección de comparaciones múltiples.

0 votos

@Scortchi Gracias por tu aportación, pero no entiendo a qué te refieres con que "la tasa de error del experimento no está controlada por las quince comparaciones individuales que se planifican".

1 votos

Sólo el punto básico que si Si desea controlar la probabilidad bajo la nulidad de cometer uno o más errores de tipo I en todas esas pruebas, deberá utilizar un procedimiento de comparaciones múltiples. Sólo lo menciono porque ya me he encontrado con una confusión al respecto.

5voto

Loffen Puntos 163

Si se sustituye la palabra "premeditado" por "planificado", esto puede ayudar a disipar el argumento ofrecido por los autores. Considere dos análisis estadísticos diferentes de los mismos datos:

  1. Un "crimen premeditado" en el que un "cerebro criminal estadístico" establece de antemano todas las pruebas de hipótesis posibles de forma combinada, con el fin de probar cada una de ellas de forma sistemática y elegir la prueba con el menor valor p como "hallazgo clave" para promoverlo en las secciones de Resultados, Discusión y Conclusión del artículo, e incluso en el Título.
  2. Un "crimen pasional" en el que la intención inicial era simplemente confrontar los datos con una hipótesis, pero "bueno... una cosa lleva a la otra" y múltiples ad hoc las pruebas de hipótesis "simplemente ocurren" en el calor de la pasión científica para aprender "algo ... ¡cualquier cosa! " de los datos.

En cualquier caso, es un "asesinato", la cuestión es si es en primer o segundo grado. Está claro que el primero es moralmente más problemático. Me parece que los autores intentan afirmar algo así como que no fue un asesinato porque fue premeditado.

4 votos

Pero hacer múltiples comparaciones no es un delito, premeditado o no. La caza de P sí lo es.

5voto

mdewey Puntos 579

Dada su actualización sobre el diseño, yo sugeriría que hicieran algún tipo de modelo log-lineal para utilizar todos los datos a la vez. Hacer los análisis por partes que han hecho parece (a) ineficaz (b) poco científico, ya que pone a prueba 15 hipótesis cuando seguramente hay menos hipótesis reales.

No soy partidario de corregir la multiplicidad como un reflejo condicionado, pero en este caso si rechazan un enfoque analítico más profundo, entonces sugeriría que lo corrigieran.

1 votos

Si todas las pruebas ponen a prueba la misma hipótesis, también se puede utilizar alguna herramienta de meta-análisis para "combinar" los resultados de las 15 pruebas en uno solo. Usted es un experto en meta-análisis, así que quizás pueda sugerir algo más específico. Como cosa más sencilla, he visto a gente calcular el valor p para obtener $k$ resultados significativos de $15$ pero esto supone una independencia que en el caso de OP obviamente no es cierta.

1 votos

@amoeba creo que sería el último recurso ya que no puedo evitar sentir que debe haber una mejor manera de analizar esto que 15+ $\chi^2$ pruebas.

1voto

Sridhar Puntos 121

Este documento aborda directamente su pregunta: http://jrp.icaap.org/index.php/jrp/article/view/514/417

(Frane, A.V., "Planned Hypothesis Tests Are Not Necessarily Exempt From Multiplicity Adjustment", Journal of Research Practice, 2015)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X