5 votos

¿Puede alguien explicar esta caricatura?

enter image description here

Realicé 160 regresiones con diversas combinaciones de conjuntos de datos, predictores y variables dependientes. Ahora estoy tratando de cribar los resultados y separar los buenos modelos que son "reales" de los que se deben al azar. Mi profesor me ha enviado esta viñeta. Parece insinuar que al utilizar $\alpha = 0.05$ es muy probable que obtenga significación en 20 conjuntos de datos.

Preguntas:

  1. Los datos aleatorios tienen una probabilidad de 0,05 de ser significativos en $\alpha = 0.05$ ?

  2. En otras palabras:

$$\Pr(sig>0.05|n=20) = 1 -(1-0.05)^{20} = 0.6415$$

No es exactamente una garantía como sugiere la caricatura.

¿Es cierto el cálculo anterior para las regresiones?

  1. ¿Existe una palabra para esta "correlación aleatoria" para que pueda investigar más?

0 votos

1. Sí, o más generalmente "si la hipótesis nula es verdadera". Los datos aleatorios no siempre significan diferencia cero o correlación cero (es decir, puedes tener datos generados aleatoriamente que estén correlacionados a r = 0,8); 2. ¿Por qué los calculas como si fueran eventos dependientes? En el dibujo animado las 20 pruebas son eventos independientes. 3. Normalmente se llama "error de tipo I" o "falso positivo".

1 votos

**Su profesor utiliza una caricatura humorística para advertirle de la trampa en la que se ha metido. No intentes discutir con la caricatura en lugar de dirigirte a la advertencia. Haces bien en querer aprender más sobre el problema: semanticommunity.info/@api/deki/files/30744/ **

0 votos

Gracias @Wayne, esa presentación es sumamente clarificadora.

2voto

Björn Puntos 457

Su cálculo es correcto suponiendo que los valores p surgen de datos que son independientes y surgen de conjuntos de datos suficientemente grandes (de modo que los valores p están realmente distribuidos de forma aproximadamente uniforme bajo la hipótesis nula). Si los datos no son independientes (por ejemplo, cuando todas las personas que fueron asignadas al azar a comer un determinado color de gominola se comparan con un único grupo de personas asignadas a no comer gominolas, o si las personas que comieron gominolas rojas se comparan con las personas que no comieron gominolas tanto en términos de aparición de acné como de cáncer o muerte), las cosas también son más complicadas.

Por lo tanto, tiene razón en que no hay garantía de que entre 20 comparaciones realizadas bajo la hipótesis nula haya al menos un error de tipo I y la tasa de error de tipo I familiar que ha calculado es exactamente correcta. Sin embargo, en el caso de 160 comparaciones, la tasa de error de tipo I familiar debería estar muy cerca del 100%. Hay varias formas posibles de tratar este tipo de multiplicidad. Entre ellas se encuentran los procedimientos de prueba que controlan la tasa de error tipo I familiar (por ejemplo, el procedimiento Bonferroni-Holm) o la tasa de falsos descubrimientos. También he visto a algunos bayesianos argumentar a favor de enfoques de reducción (implícita) utilizando algún tipo de modelo bayesiano jerárquico y es casi seguro que se podrían hacer más cosas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X