¿Existe algún programa informático fácil de usar para pulir la mediana de Tukey en filas y columnas con muchos valores perdidos?
Respuesta
¿Demasiados anuncios?Bueno R tiene medpolish incorporado, y puede hacer frente a un cierto nivel de falta:
> a # some data
[,1] [,2] [,3] [,4]
[1,] 32.45884 29.50403 38.54330 30.06207
[2,] 27.92059 25.00838 NA 13.93309
[3,] 37.91911 23.98091 36.00139 27.73731
[4,] 29.20283 29.68059 18.41809 29.92471
[5,] NA 30.98312 23.55309 22.63105
[6,] 24.96472 33.52443 24.85243 37.43364
El comando medpolish es sencillo:
> medpolish(a,na.rm=TRUE) # Pretty easy to use
1 : 86.06071
Final: 85.59585
Median Polish Results (Dataset: "a")
Overall: 29.01548
Row Effects:
[1] 2.2356134 -4.0668144 3.4436953 -0.1729532 -5.2644925 0.1729532
Column Effects:
[1] 1.2077470 0.4488938 -0.1978902 -1.1544723
Residuals:
[,1] [,2] [,3] [,4]
[1,] 0.00000 -2.19595 7.4901 -0.034543
[2,] 1.76418 -0.38917 NA -9.861103
[3,] 4.25219 -8.92715 3.7401 -3.567392
[4,] -0.84743 0.38917 -10.2265 2.236662
[5,] NA 6.78324 0.0000 0.034543
[6,] -5.43146 3.88711 -4.1381 9.399689
Por cierto, esto no es especialmente difícil de hacer en una hoja de cálculo (pero ten en cuenta que normalmente tendrías que iterarlo; no obstante, es bastante factible).
Sin embargo, si tiene realmente gran cantidad de omisiones, es posible que no pueda estimar los efectos de todas las filas y columnas (por ejemplo, si en una de ellas faltan todos los datos).
Edición: como whuber señala a continuación, un montón de falta puede dar lugar a problemas de sesgo o no convergencia