11 votos

Desviación frente a bondad de ajuste de Pearson

Estoy intentando elaborar un modelo utilizando la regresión binomial negativa (GLM binomial negativa). Tengo un tamaño de muestra relativamente pequeño (superior a 300) y los datos no están escalados. He visto que hay dos formas de medir la bondad del ajuste: una es la desviación y la otra es el estadístico de Pearson. ¿Cómo puedo determinar qué medida de bondad de ajuste debo utilizar? ¿Existen algunos criterios que pueda tener en cuenta para seleccionar la medida de bondad de ajuste?

0 votos

No estoy seguro de lo que quiere decir con "tengo un tamaño de muestra relativamente pequeño (superior a 300)".

0 votos

@Dason 300 no es un número muy grande en como la expresión génica

11voto

jasonmray Puntos 1303

La prueba de bondad de ajuste basada en la desviación es una prueba de razón de verosimilitud entre el modelo ajustado y el saturado (uno en el que cada observación tiene su propio parámetro). La prueba de Pearson es una prueba de puntuación; el valor esperado de la puntuación (la primera derivada de la función log-verosimilitud) es cero si el modelo ajustado es correcto, y se considera que una diferencia mayor respecto a cero es una prueba más contundente de falta de ajuste. La teoría se analiza en Smyth (2003), "Pearson's goodness of fit statistic as a score test statistic", Estadística y ciencia: un homenaje a Terry Speed .

En la práctica, la gente suele confiar en la aproximación asintótica de ambas a la distribución chi-cuadrado: para un modelo binomial negativo, esto significa que los recuentos esperados no deberían ser demasiado pequeños. Smyth señala que la prueba de Pearson es más robusta frente a la especificación errónea del modelo, ya que sólo se considera el modelo ajustado como nulo sin tener que asumir una forma particular para un modelo saturado. Nunca he notado mucha diferencia entre ellos.

Quizá quiera reflexionar sobre el hecho de que una falta de ajuste significativa con cualquiera de los dos le dice lo que probablemente ya sabe: que su modelo no es una representación perfecta de la realidad. Es más probable que le digan esto cuanto mayor sea el tamaño de su muestra. Quizá sea más pertinente preguntarse si puede mejorar su modelo y qué métodos de diagnóstico pueden ayudarle.

0 votos

//El test de bondad de ajuste basado en la desviación es un test de razón de verosimilitud entre el modelo ajustado y el saturado // ¿Así que el modelo ajustado no es un modelo anidado del modelo saturado? Creía que la prueba LR sólo funcionaba con modelos anidados.

0 votos

@DomJo: El modelo ajustado estará anidado en el modelo saturado, y por lo tanto la prueba LR funciona (o más exactamente el doble de la diferencia en log-verosimilitud tiende a una distribución chi-cuadrado a medida que el tamaño de la muestra aumenta).

0 votos

Tengo una duda al respecto. En el modelo saturado, hay n parámetros, uno para cada observación. Pero el modelo ajustado tiene algunas variables predictoras (digamos x1, x2 y x3). Entonces, ¿el modelo saturado y el modelo ajustado tienen diferentes predictores? Esto es lo que me confunde y no puedo encontrar un documento en internet que establezca la hipótesis como una ecuación matemática

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X