Tengo un conjunto de datos que consiste en mediciones del tiempo de reacción (TR). Éstas se utilizarán para calcular la duración de los ensayos experimentales en un estudio de IRM. En cada bloque (condición experimental) hay 10 ensayos. Ahora, debido a varios problemas, hay algunos RTs que faltan. Debido a la naturaleza del análisis de la RMN, necesito los valores de los 10 ensayos por bloque. Si faltan más de 5 valores, probablemente los descartaré del análisis por completo, pero si sólo faltan 1 o 2, planeo utilizar el valor medio de RT para esa condición en lugar del valor que falta. Sin embargo, quiero asegurarme de que esta es una decisión de principio, ya que los valores de RT en algunas condiciones, por el mismo participante, pueden ser muy variables.
¿Cómo puedo utilizar la desviación estándar o el error estándar de la media para asegurarme de que es "justo" utilizar la media en lugar del valor que falta? Por ejemplo, vea los datos siguientes.
Bloque 1 - Valores perdidos: 2; Media: 740; SD: 519; SEM: 196. Bloque 2 - Valores perdidos: 1; Media: 2245; DT: 292; SEM: 97.
Intento encontrar una forma honesta y coherente de decidir si la decisión de sustituir el valor que falta por la media es acertada. En caso de que no lo sea, prefiero dejar el bloque fuera del análisis antes que sesgar los datos.
¿Algún consejo? Espero que esto tenga sentido.