Buenas tardes, Tengo una duda sobre cómo tratar mis datos: Tengo algunos datos que faltan y me gustaría completarlos con la media, pero algunos de mis ítems deben ser invertidos. Así que me preguntaba si debo invertir mis elementos y luego calcular la media? ¿O debo calcular la media y sólo entonces puedo sustituir los datos que faltan por la media? Gracias a todos
Respuesta
¿Demasiados anuncios?El hecho de que primero recodifique sus datos y luego tome la media, o que primero tome la media y luego recodifique, no debería suponer ninguna diferencia, simplemente porque
$$ \frac{1}{n}\sum_{i=1}^n(ax_i+b) = a\bigg(\frac{1}{n}\sum_{i=1}^n x_i\bigg)+b $$
(con $a=-1$ y $b=0$ ).
Tenga en cuenta que al rellenar los datos que faltan con la media se eliminará toda la incertidumbre que definitivamente está presente en sus datos. Estará demasiado seguro de sus conclusiones, sean las que sean. Hay formas más inteligentes de imputar los datos que faltan, y personalmente creo que en lugar de imputar la media, probablemente sea mejor que elimine las observaciones con datos que faltan en cada caso. Véase también ¿Introduce la imputación un sesgo inaceptable?