4 votos

¿Cómo interpreto este gráfico de diagnóstico residual?

enter image description here

Estoy aprendiendo a entender cómo utilizar los gráficos de residuos para mejorar los modelos de regresión. Parece que el siguiente gráfico de residuos frente a los ajustados es enormemente problemático, ya que tiene un patrón. Pero, ¿cómo puedo identificar las causas más probables de este problema?

El siguiente es un gráfico de residuos vs. ajuste cuando la variable dependiente está transformada en logaritmo. Supongo que el mismo problema de patrón persiste:

enter image description here

2 votos

¿Puede dar más detalles sobre el modelo que ha generado este gráfico de residuos? ¿Cuál era la variable dependiente? ¿Cuáles eran las variables independientes? ¿Incluía el modelo alguna interacción entre alguna de las variables independientes? No podemos comentar las mejoras de su modelo si ni siquiera sabemos cuál es el modelo. Además, ¿cuál es el objetivo final de su modelo?

3 votos

Gracias @IsabellaGhement. La variable dependiente es el número de días que tarda un individuo en conseguir un préstamo. Los predictores del modelo incluyen el tamaño del préstamo solicitado (en dólares), el número de prestatarios y la descripción del préstamo (medidas de análisis de texto como recuentos de frecuencia relativa de palabras; por ejemplo, tono positivo/tono negativo). El modelo no incluye ninguna interacción. Espero que esto aporte algunas aclaraciones.

5voto

David J. Sokol Puntos 1730

El tensor de inercia es el objeto que nos indica cómo se convierte la velocidad angular en energía cinética o momento angular y, por tanto, desempeña un papel similar al de la masa en el movimiento rectilíneo. Para entender físicamente por qué este factor de conversión es sólo un número en un caso pero es un tensor en el otro sólo tenemos que notar que ambas cantidades representan la inercia total del sistema.

Debido a la isotropía del espacio, la inercia de la partícula en movimiento rectilíneo está completamente determinada por un solo parámetro, la masa. Sin embargo, en el movimiento de rotación, los diferentes ejes de rotación de un mismo cuerpo muestran en general diferentes inercias y un solo escalar no será suficiente para describir cómo se convierte la velocidad angular en energía cinética. Para describir completamente la inercia del cuerpo con respecto a un punto determinado necesitamos en general seis parámetros, tres para fijar la orientación de los ejes de coordenadas y tres para cuantificar la inercia con respecto a cada uno de estos ejes.

Al tener que especificar seis números, la inercia del cuerpo requiere al menos un tensor simétrico de segundo rango para ser representado. Si el cuerpo tiene simetrías particulares, el número total de parámetros diferentes se reduce. Por ejemplo, consideremos una esfera homogénea centrada en el origen que es fijo. Con respecto a ese punto, cada orientación de los ejes es equivalente, por lo que no necesitamos ningún parámetro para fijar el sistema de coordenadas. Además, las rotaciones a lo largo de cada uno de los tres ejes también son equivalentes, la inercia debe ser la misma. Por lo tanto, la inercia de la esfera homogénea se describe con un solo escalar y el tensor de inercia es un múltiplo del tensor de identidad.

0 votos

Gracias @GavinSimpson por tan detalladas y muy útiles aclaraciones y sugerencias. Basándome en tu aportación, primero intenté la transformación logarítmica de la variable dependiente (días-para-financiar-préstamo). El gráfico de residuos frente a los valores ajustados muestra una dispersión uniforme hasta que el valor ajustado es < 8 y, a continuación, un claro patrón de pendiente descendente (algo pronunciado). Según tengo entendido, esto también es problemático. Probaré el GLM con la familia Poisson. ¿Son aplicables a la familia Poisson gráficos de diagnóstico de residuos e interpretaciones similares?

0 votos

En cuanto a tu otro punto, @GavinSimpson, tengo la flexibilidad de codificar los días para financiar el préstamo como 2,4 días o redondear a 2 días, y de forma similar codificar los préstamos financiados el mismo día como 0,5 o 0 días. Como usted sugirió, voy a comprobar la distribución Gamma también.

0 votos

No se puede responder o utilizar este único diagrama de diagnóstico para identificar todos los problemas de modelado. Su modelo claro sigue teniendo un sesgo considerable en los valores ajustados más grandes. Si observa los valores ajustados frente a los observados, verá el problema del sesgo. Además, puede trazar los residuos contra sus variables predictoras para diagnosticar si necesita diferentes formas funcionales para los efectos de sus covariables.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X