32 votos

¿Por qué encontrar pequeños efectos en grandes estudios indica un sesgo de publicación?

Varios trabajos metodológicos (por ejemplo, Egger et al 1997a, 1997b) analizan el sesgo de publicación revelado por los meta-análisis, utilizando gráficos de embudo como el que se muestra a continuación. Funnel plot of beta blockers in myocardial infarction

El documento de 1997b continúa diciendo que "si el sesgo de publicación está presente, se espera que, de los estudios publicados, los más grandes informen de los efectos más pequeños". Pero, ¿por qué? Me parece que todo esto demostraría lo que ya sabemos: los efectos pequeños sólo son detectables con muestras de gran tamaño mientras que no dice nada sobre los estudios que no se han publicado.

Además, el trabajo citado afirma que la asimetría que se evalúa visualmente en un gráfico de embudo "indica que hubo una no publicación selectiva de ensayos más pequeños con un beneficio menos considerable". Pero, de nuevo, no entiendo cómo cualquier características de los estudios que fueron publicado puede decirnos algo (permitirnos hacer inferencias) sobre obras que fueron no ¡publicado!

Referencias
Egger, M., Smith, G. D., y Phillips, A. N. (1997). Meta-análisis: principios y procedimientos . BMJ, 315(7121), 1533-1537.

Egger, M., Smith, G. D., Schneider, M., & Minder, C. (1997). Sesgo en el meta-análisis detectado por una simple prueba gráfica . BMJ , 315(7109), 629-634.

0 votos

No creo que lo hayas entendido bien. Tal vez la respuesta a esta pregunta podría ayudar stats.stackexchange.com/questions/214017/

7 votos

Para que un estudio pequeño se publique, tendrá que mostrar un efecto grande, independientemente del tamaño real del efecto.

30voto

Cliff AB Puntos 3213

En primer lugar, tenemos que pensar en lo que es el "sesgo de publicación" y en cómo afectará a lo que realmente llega a la literatura.

Un modelo bastante simple para el sesgo de publicación es que recogemos algunos datos y si $p < 0.05$ publicamos. Si no, no lo hacemos. ¿Cómo afecta esto a lo que vemos en la literatura? Bueno, en primer lugar, garantiza que $|\hat \theta |/ SE(\hat \theta) >1.96$ (suponiendo que se utilice una estadística de Wald). El punto clave que se plantea es que si $n$ es realmente pequeño, entonces $SE(\hat \theta)$ es relativamente grande y un gran $|\hat \theta|$ es requerido para su publicación.

Ahora supongamos que en la realidad, $\theta$ es relativamente pequeño. Supongamos que realizamos 200 experimentos, 100 con tamaños de muestra realmente pequeños y 100 con tamaños de muestra realmente grandes. Obsérvese que de los 100 experimentos con tamaños de muestra realmente pequeños, los únicos que se publicarán según nuestro modelo simple de sesgo de publicación son aquellos con valores grandes de $|\hat \theta|$ sólo por un error aleatorio . Sin embargo, en nuestros 100 experimentos con muestras de gran tamaño, los valores de $\hat \theta$ se publicará. Así que si los experimentos más grandes muestran sistemáticamente un efecto menor que los experimentos más pequeños, esto sugiere que tal vez $|\theta|$ es en realidad significativamente menor que lo que solemos ver en los experimentos más pequeños que llegan a publicarse.

Nota técnica: es cierto que, o bien tener un gran $|\hat \theta|$ y/o pequeño $SE(\hat \theta)$ llevará a $p < 0.05$ . Sin embargo, dado que los tamaños de los efectos suelen considerarse como relativos a la desviación estándar del término de error, estas dos condiciones son esencialmente equivalentes.

0 votos

"Ahora, un punto que se hace es que si $n$ es realmente pequeño, entonces $SE(\theta)$ es relativamente grande y un gran $|\theta|$ es requerido para su publicación". Esto no es, técnicamente hablando, necesariamente cierto: $SE(\theta) = \frac{SD(\theta)}{\sqrt{n}}$ : si $SE(\theta)$ es muy pequeño, entonces un pequeño $SE$ puede resultar incluso para un tamaño de muestra pequeño, ¿verdad? EDITAR: ¡Oh, espera! Acabo de leer tu frase final. :) +1

23voto

transmetro Puntos 41

Las respuestas aquí son buenas, +1 a todos. Sólo quería mostrar cómo podría verse este efecto en términos de gráfico de embudo en un caso extremo. A continuación simulo un pequeño efecto como $N(.01, .1)$ y extraer muestras de entre 2 y 2000 observaciones.

Los puntos grises de la trama no se publicarían bajo una estricta $p < .05$ régimen. La línea gris es una regresión del tamaño del efecto sobre el tamaño de la muestra que incluye los estudios con "malos valores p", mientras que la roja los excluye. La línea negra muestra el efecto verdadero.

Como se puede ver, en el sesgo de publicación hay una fuerte tendencia a que los estudios pequeños sobrestimen los tamaños del efecto y a que los más grandes informen de tamaños del efecto más cercanos a la verdad.

set.seed(20-02-19)

n_studies <- 1000
sample_size <- sample(2:2000, n_studies, replace=T)

studies <- plyr::aaply(sample_size, 1, function(size) {
  dat <- rnorm(size, mean = .01, sd = .1)
  c(effect_size=mean(dat), p_value=t.test(dat)$p.value)
})

studies <- cbind(studies, sample_size=log(sample_size))

include <- studies[, "p_value"] < .05

plot(studies[, "sample_size"], studies[, "effect_size"], 
     xlab = "log(sample size)", ylab="effect size",
     col=ifelse(include, "black", "grey"), pch=20)
lines(lowess(x = studies[, "sample_size"], studies[, "effect_size"]), col="grey", lwd=2)
lines(lowess(x = studies[include, "sample_size"], studies[include, "effect_size"]), col="red", lwd=2)
abline(h=.01)

Creado en 2019-02-20 por el paquete reprex (v0.2.1)

1 votos

Excelente punto, realmente ayuda a entender esto intuitivamente, ¡gracias!

2 votos

+1 Este gráfico vale más que mil palabras y resume bien el problema. Este tipo de sesgo puede encontrarse incluso cuando el verdadero tamaño del efecto es 0.

20voto

George Puntos 191

Lee esta afirmación de otra manera:

Si no hay sesgo de publicación, el tamaño del efecto debería ser independiente del tamaño del estudio.

Es decir, si se estudia un fenómeno, el tamaño del efecto es una propiedad del fenómeno, no de la muestra/estudio.

Las estimaciones del tamaño del efecto pueden variar (y lo harán) entre los estudios, pero si hay una disminución sistemática del tamaño del efecto al aumentar el tamaño del estudio que sugiere que hay un sesgo. La cuestión es que esta relación sugiere que hay pequeños estudios adicionales que muestran un tamaño del efecto bajo que no se han publicado, y si se publicaran y por lo tanto pudieran incluirse en un metanálisis, la impresión general sería que el tamaño del efecto es menor que el estimado a partir del subconjunto de estudios publicados.

La varianza de las estimaciones del tamaño del efecto entre los estudios dependerá del tamaño de la muestra, pero debería ver un número igual de estimaciones por debajo y por encima en tamaños de muestra bajos si no hubiera sesgo.

1 votos

Pero ¿es realmente correcto decir que "si no hay sesgo de publicación, el tamaño del efecto debería ser independiente del tamaño del estudio"? Esto es cierto, por supuesto, cuando se refiere al verdadero efecto subyacente, pero creo que se refieren al efecto estimado. Un tamaño del efecto que es dependiente del tamaño del estudio (lo que sugiere un sesgo) equivale a una relación lineal en ese gráfico de dispersión (alta correlación). Esto es algo que personalmente no he visto en ningún gráfico de embudo, aunque por supuesto muchos de esos gráficos de embudo hizo implican la existencia de un sesgo.

2 votos

@z8080 Tienes razón, sólo si las estimaciones de la media y la desviación estándar son insesgadas, el tamaño del efecto estimado será completamente independiente del tamaño del estudio si no hay sesgo de publicación. Como la desviación estándar de la muestra está sesgada, habrá algún sesgo en las estimaciones del tamaño del efecto, pero ese sesgo es pequeño comparado con el nivel de sesgo entre estudios al que se refieren Egger et al. En mi respuesta lo estoy tratando como insignificante, asumiendo que el tamaño de la muestra es lo suficientemente grande como para que la estimación de la DE sea casi insesgada, y por lo tanto considerándola independiente del tamaño del estudio.

2 votos

@z8080 El desviación de las estimaciones del tamaño del efecto dependerá del tamaño de la muestra, pero debería ver un número igual de estimaciones por debajo y por encima en tamaños de muestra bajos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X