4 votos

¿Cómo elegir y realizar una prueba de bondad de ajuste?

Me he dado cuenta de que hay muchas preguntas sobre el tema (la mayoría son del tipo: cómo hacer una prueba de bondad de ajuste de Chi-cuadrado), pero la mía es quizás más general.

Utilizando un ejemplo que encontré recientemente. Tengo un conjunto de datos de una muestra, donde los datos son estrictamente positivos, y tienen una distribución sesgada a la derecha. Hago una adivinar que los datos pueden ajustarse a una de las cuatro distribuciones:

  1. Log-normal
  2. Exponencial
  3. Weibull
  4. Gamma

Al principio, evalúo la distribución visualmente utilizando geom_histotgram (del paquete ggplot2 ) y trazar las distribuciones estimadas utilizando stat_function donde los parámetros de la distribución se estiman utilizando fitdistr (del paquete MASS ).

ggplot(DT4, aes(TTE)) + geom_histogram(aes(y=..density..), bins=90) +
  stat_function(fun=dlnorm,args=fitdistr(DT4[, TTE],"log-normal")$estimate, color=pal[1], size=.5) +
  stat_function(fun=dexp,args=fitdistr(DT4[, TTE],"exponential")$estimate, color=pal[2], size=.5) +
  stat_function(fun=dweibull,args=fitdistr(DT4[, TTE],"weibull")$estimate, color=pal[3], size=.5) +
  stat_function(fun=dgamma,args=fitdistr(DT4[, TTE],"gamma")$estimate, color=pal[4], size=.5) +
  annotate("text", label="Log-normal", x=250, y=0.025, color=pal[1]) +
  annotate("text", label="Exponential", x=250, y=0.023, color=pal[2]) +
  annotate("text", label="Weibull", x=250, y=0.021, color=pal[3]) +
  annotate("text", label="Gamma", x=250, y=0.019, color=pal[4])

enter image description here

Las cuatro distribuciones se ajustan bastante bien, siendo la log-normal la que mejor se ajusta, sólo a partir de una evaluación visual.

Sin embargo, imagina que eres un estadístico profesional (que no lo soy) que quiere evaluar el ajuste con rigor. He buscado y he encontrado numerosas pruebas de bondad de ajuste, entre ellas

  1. Prueba Chi-cuadrado / G (diseñada para datos discretos, pero puede aplicarse a datos continuos si se dividen en intervalos arbitrarios)
  2. Kolmogorov-Smirnov
  3. Cramér-von Mises
  4. Anderson-Darling
  5. Estimación de máxima probabilidad
  6. Criterios de información: AIC/AIC $_\text{c}$ /CAIC/BIC/HQIC
  7. ¿Alguna otra que se me haya escapado?

Pregunta

  1. ¿Cómo elegimos qué bondad de ajuste utilizar para comparar el ajuste de diferentes distribuciones? En casos sencillos, una distribución puede tener el mejor ajuste según todas las pruebas, pero en casos más marginales, ¿qué pasa si una distribución es la mejor según una prueba, y otra es la mejor según otra prueba? (¿Hay alguna referencia, como un capítulo de un libro, que explore esta cuestión?)

  2. ¿Existe una función/paquete de R que realice convenientemente una serie de pruebas de bondad de ajuste a la vez?

7voto

¡Gran pregunta! (¡Casi un estadístico profesional aquí!) Vamos a ver si puedo tratar de responder a su pregunta. Whuber dio un comentario sobre lo que la estrategia típica que alguien podría seguir. Voy a tratar de complementar eso proporcionando un par de documentos que hablan específicamente de las propiedades de las pruebas cuando se violan los supuestos. Hago esto porque, si tuviera que elegir entre múltiples pruebas de bondad de ajuste, haría un proceso de eliminación diciendo qué pruebas son menos "válidas" dados mis datos y las posibles fuentes de ruido.

Cuando se trata de pruebas de bondad de ajuste, hay que tener en cuenta algunos criterios diferentes, y los supuestos sobre las distribuciones estimadas tienden a ser importantes; el grado en que lo son (es decir, la solidez ante las violaciones de los supuestos varía). Algunos de los artículos que aparecen a continuación hablan de la validez y la bondad del ajuste bajo diferentes violaciones de los supuestos.

Estimación de los parámetros en la prueba de Kolmogorov Smirnov

En la prueba de Kolmogorov Smirnoff, por ejemplo, en la comparación de la distribución empírica con la teórica, si hay que estimar los parámetros para realizar la prueba, entonces los valores p no son técnicamente válidos. En el documento que figura a continuación se hace un rápido repaso de esta cuestión.

Lilliefors, H. W. (1969). On the Kolmogorov-Smirnov test for the exponential distribution with mean unknown. Journal of the American Statistical Association, 64(325), 387-389. https://amstat.tandfonline.com/doi/pdf/10.1080/01621459.1969.10500983?needAccess=true#.Xh3UTFNKhQI

Prueba de Chi-cuadrado con varianza heterogénea

Normalmente, en la regresión, asumimos una varianza constante. A veces no es así, pero existen alternativas sólidas al chi-cuadrado estándar. En este artículo se habla de un estadístico que es asimétricamente chi-cuadrado pero que también es robusto a la varianza no constante.

Lipsitz, Stuart R., y John F. Buoncristiani. "Una estadística robusta de prueba de bondad de ajuste con aplicación a modelos de regresión ordinal". Statistics in medicine 13, no. 2 (1994): 143-152. https://onlinelibrary.wiley.com/doi/abs/10.1002/sim.4780130205

Uso de la distancia de Mahalonobis para mitigar los valores atípicos

Cerioli, Andrea, Alessio Farcomeni y Marco Riani. "Distancias robustas para pruebas de bondad de ajuste sin valores atípicos". Computational Statistics & Data Analysis 65 (2013): 29-45. https://www.sciencedirect.com/science/article/pii/S016794731200134X

Bondad del paquete R de ajuste

Aquí hay un par de paquetes que realizan pruebas específicas de bondad de ajuste. No sé si existe uno que las haga todas a la vez. Seguiré buscando a ver si encuentro alguno.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X