19 votos

¿Sidak o Bonferroni?

Estoy utilizando un modelo lineal generalizado en el SPSS para observar las diferencias en el número promedio de orugas (no normal, utilizando la distribución Tweedie) en 16 especies diferentes de plantas.

Quiero hacer múltiples comparaciones pero no estoy seguro de si debo usar una prueba de corrección de Sidak o Bonferroni. ¿Cuál es la diferencia entre las dos pruebas? ¿Es una mejor que la otra?

1 votos

Odio el hecho de que estas correcciones sean necesarias a menudo con las pruebas de hipótesis frecuentistas estándar y prefiero las técnicas bayesianas. Dicho esto, odio menos la corrección de Sidak porque parece menos ad-hoc (si estás dispuesto a aceptar el supuesto de independencia). Sin embargo, esto es sobre todo una preferencia personal, por lo que lo he convertido en un comentario en lugar de una respuesta.

2 votos

@MichaelMcGowan: Sólo por curiosidad, pero, ¿qué considera usted " ad hoc " sobre una corrección de Bonferroni?

0 votos

@cardinal Lo siento, probablemente no fue la mejor elección de palabras. A costa de necesitar supuestos más fuertes (no quiero trivializar ese coste), la corrección de Sidak crea un límite con más significado cualitativo. Realmente no puedo explicar cualitativamente lo que representa el límite en la corrección de Bonferroni, aparte de una especie de límite en el peor de los casos según la desigualdad de Boole.

26voto

Sean Hanley Puntos 2428

Si se ejecuta $k$ pruebas estadísticas independientes utilizando $\alpha$ como su nivel de significación, y el nulo se obtiene en cada caso, el hecho de encontrar o no "significación" es simplemente una extracción de una variable aleatoria. En concreto, se extrae de una distribución binomial con $p=\alpha$ y $n=k$ . Por ejemplo, si planea realizar 3 pruebas con $\alpha=.05$ y (sin saberlo) no hay realmente ninguna diferencia en cada caso, entonces hay un 5% de posibilidades de encontrar un resultado significativo en cada prueba. De este modo, la tasa de error de tipo I se mantiene en $\alpha$ para las pruebas individualmente, pero en el conjunto de las 3 pruebas la tasa de error de tipo I a largo plazo será mayor. Si cree que tiene sentido agrupar / pensar en estas 3 pruebas juntas, entonces puede mantener la tasa de error de tipo I en $\alpha$ para el conjunto en su conjunto en lugar de hacerlo individualmente. ¿Cómo hay que hacerlo? Hay dos enfoques que se centran en pasar de la $\alpha$ (es decir, $\alpha_o$ ) a un nuevo valor (es decir, $\alpha_{\rm new}$ ):

Bonferroni: ajustar el $\alpha$ utilizado para evaluar la "importancia" de manera que

$$\alpha_{\rm new}=\frac{\alpha_{o}}{k}\qquad\qquad\quad$$

Dunn-Sidak: ajustar $\alpha$ utilizando

$$\alpha_{\rm new}=1-(1-\alpha_{o})^{1/k}$$

(Tenga en cuenta que el Dunn-Sidak supone que todas las pruebas dentro del conjunto son independientes entre sí y podría producir una inflación de errores de tipo I a nivel familiar si ese supuesto no se cumple).

Es importante tener en cuenta que al realizar las pruebas, hay dos tipos de errores que se quiere evitar, tipo I (es decir, decir que hay es una diferencia cuando no la hay) y el tipo II (es decir, decir que hay no es una diferencia cuando realmente la hay). Normalmente, cuando se habla de este tema, sólo se habla -y parece que sólo se tiene en cuenta/se preocupa- de los errores de tipo I. Además, a menudo se olvida mencionar que el porcentaje de error calculado sólo se mantiene si todo Los nulos son verdaderos. Es trivialmente obvio que no se puede cometer un error de tipo I si la hipótesis nula es falsa, pero es importante tener este hecho explícitamente en mente cuando se discute esta cuestión.

Traigo esto a colación porque hay implicaciones de estos hechos que parece que a menudo no se tienen en cuenta. En primer lugar, si $k>1$ El enfoque de Dunn-Sidak ofrecerá una mayor potencia (aunque la diferencia puede ser muy pequeña con pequeños $k$ ), por lo que siempre se debe preferir (cuando sea aplicable). En segundo lugar, un "reducción debe utilizarse. Es decir, probar primero el mayor efecto; si se está convencido de que el nulo no se obtiene en ese caso, entonces el número máximo posible de errores de tipo I es $k-1$ por lo que la siguiente prueba deberá ajustarse en consecuencia, y así sucesivamente. (Esto suele incomodar a la gente y parecer una pesca, pero es no pesca, ya que las pruebas son independientes, y usted pretendía realizarlas antes de ver los datos. Esto es sólo una forma de ajustar $\alpha$ óptimamente).

Lo anterior es válido independientemente de cómo se valoren los errores de tipo I en relación con los de tipo II. Sin embargo, a-priori no hay ninguna razón para creer que los errores de tipo I sean peores que los de tipo II (a pesar de que todo el mundo parece suponerlo). Por el contrario, se trata de una decisión que debe tomar el investigador, y debe ser específica para esa situación. Personalmente, si estoy ejecutando la teoría sugerida, a-priori , contrastes ortogonales, no suelo ajustar $\alpha$ .

(Y para decirlo de nuevo, porque es importante, todo lo anterior supone que las pruebas son independientes. Si los contrastes no son independientes, como cuando se comparan varios tratamientos con el mismo control, hay que adoptar un enfoque diferente al de $\alpha$ ajuste, como la prueba de Dunnett).

0 votos

+1. ¿Lo que usted llama un enfoque "descendente" para Bonferroni es exactamente equivalente a lo que se conoce como método Holm-Bonferroni? Si es así, ¿tiene nombre la misma lógica aplicada a Dunn-Sidak?

2 votos

@amoeba, sí, a veces se llama "método de Holm", de ahí Holm-Bonferroni o Holm-Sidak.

0 votos

Gracias. Otra pregunta que tengo es acerca de su afirmación de que si usted está ejecutando teóricamente sugerido, a priori, contrastes ortogonales, que no suelen ajustar $\alpha$ . ¿Qué importancia tiene aquí el término "ortogonal"? Por ejemplo, si tiene 6 grupos de sujetos y compara los grupos 2, 3, 4, 5 y 6 con el grupo 1 (en el que el grupo 1 podría ser, por ejemplo, un grupo de control), se trata de contrastes no ortogonales. ¿Le parecería diferente ajustar $\alpha$ en este caso que cuando sus contrastes son efectivamente ortogonales, como 1-2, 3-4, 5-6? Si es así, ¿por qué?

9voto

Momo Puntos 5125

Denota con $\alpha^*$ el nivel de significación corregido, entonces Bonferroni funciona así: Dividir el nivel de significación $\alpha$ por el número $n$ de pruebas, es decir $\alpha^*=\alpha/n$ . Sidak funciona así (si las pruebas son independientes): $\alpha^*=1 (1 \alpha)^{1/n}$ .

Porque $\alpha/n < 1 (1 \alpha)^{1/n}$ La corrección de Sidak es un poco más potente (es decir, se obtienen resultados significativos con más facilidad), pero la de Bonferroni es un poco más sencilla de manejar.

Si necesita un procedimiento aún más potente, puede utilizar el procedimiento de Bonferroni-Holm.

0 votos

¿Por qué Bonferroni es más sencillo de manejar?

4 votos

Me parece que dividir $\alpha$ por $n$ algebraicamente más sencillo que calcular $1-(1-\alpha)^{1/n}$ pero me da pereza. Además, Bonferroni no asume la indenpendencia, por lo que es "más simple" en el sentido de asumir menos. Pero se paga el precio de ser más conservador.

0 votos

@Momo Los ordenadores son muy, muy buenos en aritmética, así que el argumento de la simplicidad no me parece muy convincente. Hace cien años, cuando los cálculos se hacían a mano, era una historia muy diferente, por supuesto.

6voto

Sridhar Puntos 121

Sidak y Bonferroni son tan similares que probablemente obtendrá el mismo resultado independientemente del procedimiento que utilice. Bonferroni es sólo marginalmente más conservador que Sidak. Por ejemplo, para 2 comparaciones y un alfa familiar de 0,05, Sidak realizaría cada prueba a 0,0253 y Bonferroni realizaría cada prueba a 0,0250.

Muchos comentaristas de este sitio han dicho que Sidak sólo es válido cuando las estadísticas de prueba de sus comparaciones son independientes. Eso no es cierto. Sidak permite una ligera inflación de la tasa de error familiar cuando los estadísticos de la prueba son NEGATIVAMENTE dependientes, pero si se realizan pruebas de dos caras, la dependencia negativa no suele ser un problema. Cuando la dependencia no es negativa, Sidak proporciona un límite superior en la tasa de error familiar. Dicho esto, hay otros procedimientos que proporcionan dicho límite y tienden a conservar más poder estadístico que Sidak. Así que Sidak probablemente no sea la mejor opción.

Algo que proporciona el procedimiento de Bonferroni (que no ofrece Sidak) es un control estricto del número esperado de errores de tipo I, la llamada "tasa de error por familia", que es más conservadora que la tasa de error por familia. Para más información, véase: Frane, AV (2015) "¿Son relevantes las tasas de error de tipo I por familia en las ciencias sociales y del comportamiento?" Revista de Métodos Estadísticos Aplicados Modernos 14 (1), 12-23.

5voto

Berek Bryan Puntos 349

La corrección de Sidak supone que las pruebas individuales son estadísticamente independientes. La corrección de Bonferroni no lo supone.

0 votos

¿Significa eso que el Bonferroni es simplemente una prueba más conservadora?

1 votos

Bonferroni es más conservador cuando ambas pruebas son apropiadas. Pero si sus pruebas no son independientes, no debería utilizar Sidak.

2 votos

+1 El hecho de que la corrección de Bonferroni no requiera que las pruebas sean independientes es un buen punto que no he cubierto.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X