Estoy intentando utilizar un gráfico de residuos para comprender mejor mi conjunto de datos y lo que debería hacer.
Mis datos son una serie de etiquetas puntuadas con un montón de características de distancia utilizadas para predecirlas. Espero utilizar la regresión lineal.
Cuando generé mi gráfico residual, obtuve el siguiente gráfico inusual que no había visto antes.
Según mis limitados conocimientos, sé que lo ideal sería que un gráfico de residuos contuviera un grupo de puntos con una media de 0. En el peor de los casos, el gráfico no es aleatorio; la mayoría de los ejemplos indican un valor de error residual elevado en un valor predicho determinado.
Sin embargo, mi gráfico no se parece en nada a los ejemplos que he visto y no estoy seguro de cómo interpretarlo. ¿Es posible que mi conjunto de datos no sea adecuado para un modelo de regresión? ¿Qué indica el gráfico de residuos sobre mis datos?
Información adicional que puede ser útil:
valor r2: 0,32812704493994505