5 votos

Software para el pulido de medianas

¿Existe algún programa informático fácil de usar para pulir la mediana de Tukey en filas y columnas con muchos valores perdidos?

6voto

AdamSane Puntos 1825

Bueno R tiene medpolish incorporado, y puede hacer frente a un cierto nivel de falta:

 > a  # some data
          [,1]     [,2]     [,3]     [,4]
 [1,] 32.45884 29.50403 38.54330 30.06207
 [2,] 27.92059 25.00838       NA 13.93309
 [3,] 37.91911 23.98091 36.00139 27.73731
 [4,] 29.20283 29.68059 18.41809 29.92471
 [5,]       NA 30.98312 23.55309 22.63105
 [6,] 24.96472 33.52443 24.85243 37.43364

El comando medpolish es sencillo:

 > medpolish(a,na.rm=TRUE)    # Pretty easy to use
 1 : 86.06071 
 Final: 85.59585 

 Median Polish Results (Dataset: "a")

 Overall: 29.01548 

 Row Effects:
 [1]  2.2356134 -4.0668144  3.4436953 -0.1729532 -5.2644925  0.1729532

 Column Effects:
 [1]  1.2077470  0.4488938 -0.1978902 -1.1544723

 Residuals:
          [,1]     [,2]     [,3]      [,4]
 [1,]  0.00000 -2.19595   7.4901 -0.034543
 [2,]  1.76418 -0.38917       NA -9.861103
 [3,]  4.25219 -8.92715   3.7401 -3.567392
 [4,] -0.84743  0.38917 -10.2265  2.236662
 [5,]       NA  6.78324   0.0000  0.034543
 [6,] -5.43146  3.88711  -4.1381  9.399689

Por cierto, esto no es especialmente difícil de hacer en una hoja de cálculo (pero ten en cuenta que normalmente tendrías que iterarlo; no obstante, es bastante factible).

Sin embargo, si tiene realmente gran cantidad de omisiones, es posible que no pueda estimar los efectos de todas las filas y columnas (por ejemplo, si en una de ellas faltan todos los datos).

Edición: como whuber señala a continuación, un montón de falta puede dar lugar a problemas de sesgo o no convergencia

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X