3 votos

¿Cómo puedo utilizar la desviación estándar/SEM para evaluar la conveniencia de sustituir los valores perdidos por la media?

Tengo un conjunto de datos que consiste en mediciones del tiempo de reacción (TR). Éstas se utilizarán para calcular la duración de los ensayos experimentales en un estudio de IRM. En cada bloque (condición experimental) hay 10 ensayos. Ahora, debido a varios problemas, hay algunos RTs que faltan. Debido a la naturaleza del análisis de la RMN, necesito los valores de los 10 ensayos por bloque. Si faltan más de 5 valores, probablemente los descartaré del análisis por completo, pero si sólo faltan 1 o 2, planeo utilizar el valor medio de RT para esa condición en lugar del valor que falta. Sin embargo, quiero asegurarme de que esta es una decisión de principio, ya que los valores de RT en algunas condiciones, por el mismo participante, pueden ser muy variables.

¿Cómo puedo utilizar la desviación estándar o el error estándar de la media para asegurarme de que es "justo" utilizar la media en lugar del valor que falta? Por ejemplo, vea los datos siguientes.

Bloque 1 - Valores perdidos: 2; Media: 740; SD: 519; SEM: 196. Bloque 2 - Valores perdidos: 1; Media: 2245; DT: 292; SEM: 97.

Intento encontrar una forma honesta y coherente de decidir si la decisión de sustituir el valor que falta por la media es acertada. En caso de que no lo sea, prefiero dejar el bloque fuera del análisis antes que sesgar los datos.

¿Algún consejo? Espero que esto tenga sentido.

1voto

mat_geek Puntos 1367

No creo que el error estándar de la media diga nada que pueda ayudar a la imputación. Si el tamaño de la muestra es grande, será pequeño, pero no le dirá lo que quiere saber sobre la variabilidad entre sujetos. Quizá haya factores que expliquen los TR largos y cortos en relación con la media. La varianza de un caso a otro es más relevante para ayudarle a decidir si el tiempo medio sería o no útil para la imputación. Si usted tiene variables explicativas que a través de una rgeresión puede mostrar que reduce esta variabilidad entonces el modelo podría darle un mejor método para la imputación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X