4 votos

¿Cómo describiría un estadístico el problema de la figura de esta publicación? la solución?

Señalé un problema con el promedio de los valores en el tiempo aquí https://www.researchgate.net/publication/344137839_SARS-CoV-2_binds_platelet_ACE2_to_enhance_thrombosis_in_COVID-19/comments en los comentarios .

¿Cómo describiría un estadístico el problema de la figura de esta publicación? (Me imagino que si conociera la jerga para describir el problema sería más fácil encontrar la solución. Además, me parece interesante estar en la situación en la que tuve que recurrir a describir el problema de la forma en que lo hice allí).

Tengo la sensación de que la regresión lineal podría ser la herramienta adecuada, pero soy demasiado ignorante / inexperto para saberlo.

Para que la pregunta sea más legible, he aquí una copia de la figura: an average anomaly

y aquí está una copia de mi comentario: En la figura 1G, la media es engañosa, porque sube cuando los participantes abandonan el estudio, lo que generalmente hacen con valores bajos. Así que si miramos específicamente a partir del 20º 21º, notamos que ninguno de los valores saltó, y sin embargo la media salta hacia arriba. Uno de ellos aumentó ligeramente, pero la razón del salto es que el caso de color púrpura oscuro ha abandonado el estudio. Del mismo modo, si miramos específicamente del 27 al 28, observamos que el único valor baja, pero la media sube. de nuevo, esto se debe a que han caído otros casos que tenían valores bajos el día anterior. Esto es sólo un pequeño detalle y no cambia las conclusiones, pero debería utilizarse una forma mejor de mostrar la tendencia que la media.

2voto

icelava Puntos 548

En primer lugar, un par de comentarios sobre la propia figura.

Un problema es el eje vertical roto. Esto exagera la variabilidad entre los 20 casos inferiores y crea artificialmente dos grupos que se tratan de forma diferente. Probablemente sería mejor utilizar simplemente un eje vertical logarítmico.

El uso de diferentes colores para distinguir diferentes casos es dudoso. En principio, podría utilizarse para identificar casos, pero como los colores no se recogen en otras subtramas, esta identificación no es necesaria. Así que la única razón de ser de los colores sería poder identificar trayectorias específicas a lo largo del tiempo. Pero, sinceramente, aquí hay muy poco que ver, así que los colores sólo añaden desorden visual. Probablemente sería mejor utilizar simplemente un gris claro para que la media destaque.


Pasemos ahora al problema estadístico.

Identificas correctamente en tu comentario que la media sube cuando la gente abandona el estudio, presumiblemente con recuentos bajos. Este es un tipo de sesgo de selección Si sólo retenemos en nuestras observaciones a las personas que están enfermas (y, por tanto, tienen un recuento de plaquetas más alto) y dejamos de lado a los individuos que están sanos (y, por tanto, tienen un recuento más bajo), nuestra estimación del recuento medio de plaquetas estará sesgada a un nivel alto por el efecto de selección. En concreto, nos encontramos con un caso de sesgo de deserción aquí.

A menos que podamos hacer un seguimiento de la gente después de marcharse, probablemente no haya una buena manera de evitarlo. Podría ser útil indicar el número de puntos de datos en cada momento, por ejemplo, añadiendo esto como otra serie temporal con un eje vertical secundario.

0voto

Nixit Patel Puntos 34

Una línea media tiene la ventaja de que todo lector entiende una media. El problema es que cada lector esperará que la línea se trace para el mismo grupo de personas a lo largo del tiempo. Eso no es posible si se quiere dibujar la línea desde x = 0 hasta x = 35. Sin embargo, si se trazara la línea media sólo desde x = 0 hasta x = 15 sólo para aquellas personas que no están censadas dentro de [0, 15] probablemente se obtendría una buena representación de lo que le ocurre a la mayoría de las personas y para x > 15 no necesitamos realmente una media - podemos ver lo que les ocurre a estas 7 o más personas sin necesidad de agregar datos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X