En La insignificancia de las pruebas de significación Johnson (1999) señaló que los valores p son arbitrarios, en el sentido de que se pueden hacer tan pequeños como se desee reuniendo suficientes datos, suponiendo que la hipótesis nula es falsa, lo que casi siempre es. En el mundo real, es poco probable que haya correlaciones semiparciales que sean exactamente cero, que es la hipótesis nula en la prueba de significación de un coeficiente de regresión. Los límites de significación del valor P son aún más arbitrarios. El valor de 0,05 como límite entre la significación y la no significación se utiliza por convención, no por principio. Así que la respuesta a su primera pregunta es no, no hay una manera de decidir por principio un umbral de significación apropiado.
Entonces, ¿qué puede hacer, dado su gran conjunto de datos? Depende de las razones que tenga para explorar la significación estadística de sus coeficientes de regresión. ¿Está intentando modelar un sistema multifactorial complejo y desarrollar una teoría útil que se ajuste o prediga razonablemente la realidad? Entonces tal vez podría pensar en desarrollar un modelo más elaborado y adoptar una perspectiva de modelización sobre él, como se describe en Rodgers (2010), La epistemología de la modelización matemática y estadística . Una de las ventajas de tener muchos datos es poder explorar modelos muy ricos, con múltiples niveles e interacciones interesantes (suponiendo que se tengan las variables para hacerlo).
Si, por el contrario, quiere hacer algún juicio sobre si tratar un coeficiente particular como estadísticamente significativo o no, podría tomar la sugerencia de Good (1982) resumida en Woolley (2003) : Calcule el Valor q como $p\cdot\sqrt{(n/100)}$ que estandariza los valores p a un tamaño de muestra de 100. Un valor p de exactamente 0,001 se convierte en un valor p de 0,045, que sigue siendo estadísticamente significativo.
Entonces, si es significativo utilizando un umbral arbitrario u otro, ¿qué pasa con él? Si se trata de un estudio observacional, tiene usted mucho más trabajo para justificar que es realmente significativo en el sentido que usted piensa y no sólo una relación espuria que aparece porque ha especificado mal su modelo. Tenga en cuenta que un efecto pequeño no es tan interesante desde el punto de vista clínico si representa diferencias preexistentes entre las personas que se seleccionan en diferentes niveles de tratamiento en lugar de un efecto del tratamiento.
Hay que considerar si la relación que se observa es prácticamente significativa, como han señalado los comentaristas. Convirtiendo las cifras que citas de $r$ a $r^2$ para la varianza explicada ( $r$ es la correlación, se eleva al cuadrado para obtener la varianza explicada) da sólo un 3 y un 6% de varianza explicada, respectivamente, lo que no parece mucho.
10 votos
Se trata de una cuestión de significación práctica frente a la estadística. Si la pendiente es realmente diferente de 0, incluso por una cantidad minúscula (por ejemplo, 0,00000000000001), una muestra lo suficientemente grande producirá un valor muy pequeño. $p$ -valor, a pesar de que el resultado no tiene ninguna importancia práctica. Sería mejor interpretar la estimación puntual en lugar de la $p$ -valor cuando se tiene un tamaño de muestra tan grande.
0 votos
@Macro ¿podría aclarar lo que quiere decir con estimación puntual aquí?
3 votos
Además del comentario de Macro, en esta situación busco la importancia "práctica" o "clínica" de los resultados. Para lo que estás haciendo, ¿es el efecto lo suficientemente grande como para que te importe?
1 votos
La estimación puntual es la estimación de la pendiente de la regresión observada.
0 votos
@Michelle sí, algunos IV generan predicciones de hasta r=.15, y coeficientes de regresión múltiple de hasta r=.25. La motivación de mi pregunta es entender estos pequeños efectos en relación con el tamaño de la muestra y el nivel de significación. La intervención que conduce a estos efectos es muy simple, por lo que incluso un efecto pequeño es clínicamente interesante.
2 votos
Lo que @Macro y yo decimos es que hay que decidir si el efecto clínico (estimaciones puntuales, pendientes) es importante. Su umbral se basa en decidir "sí, se trata de un efecto clínico importante" en lugar de "un valor p significativo" porque la mayoría (¿todos?) de sus valores p son significativos.
0 votos
@Michelle ok entonces supongo que decido que es un efecto clínico importante. Amén.