La forma del gráfico es coherente con una distribución sesgada a la izquierda, posiblemente bimodal (con una pequeña moda a la izquierda).
Es posible que haya dos grupos con una dispersión similar (como una mezcla de dos normales con aproximadamente la misma desviación estándar, teniendo la subpoblación más pequeña una media más baja que el resto). Esto sugeriría la posibilidad de un predictor ausente, que correspondería a los dos grupos).
Sin embargo, la siguiente discusión se basa en el supuesto de regresión de que la media condicional y la dispersión de los errores es cero y constante, respectivamente, de modo que podemos interpretar el gráfico QQ de los residuos como una información sobre la distribución condicional de los errores. Obsérvese que interpretar la distribución marginal de los residuos de esta manera tiene poco sentido si los residuos proceden realmente de varias distribuciones diferentes. Hay que considerar primero otros diagnósticos, incluidos los relativos a otros posibles predictores].
Observe que hay una "parte empinada" entre las dos secciones menos empinadas de la izquierda y la derecha, pero a ambos lados de esa parte empinada la pendiente es similar:
Esto sugiere un aspecto razonablemente normal en el centro y en la derecha y también en la cola de la izquierda, pero que hay una "brecha" entre ellos con menos puntos (en torno a -1,3).
Por lo tanto, la distribución es probablemente bimodal (el segundo pico es una pequeña protuberancia a la izquierda). Se puede obtener una apariencia similar generando datos a partir de una distribución normal y dejando fuera una proporción sustancial de puntos en un intervalo cercano a -1,3.
Así:
Se trata de diez conjuntos de datos simulados de (originalmente) 400 valores cada uno de una normal estándar con puntos cercanos a -1,3 que tienen alguna posibilidad de ser omitidos; lo que resulta en una media de 349 puntos con una apariencia algo bimodal y cuyos gráficos qq tienen típicamente algo parecido a la apariencia de los suyos -- con puntos a la izquierda y al centro y a la derecha que parecen estar cerca de líneas aproximadamente paralelas, y en medio una sección más empinada (que indica la menor densidad)
2 votos
¿Podría utilizar el "qqPlot" del paquete 'car' en 'R'? Pone intervalos de confianza para la normalidad. ¿Puedes decirme cuáles son tus datos, de dónde proceden y para qué intentas utilizarlos? Entender el problema es realmente (realmente) importante antes de decir "los datos significan x". Además, necesitas más texto en tu pregunta. ¿Qué crees que significa o no significa?
1 votos
El gráfico de dispersión de los datos originales es muy útil. Un gráfico implica que la respuesta es la altura; el otro, la longitud del caparazón. ¿Puede confirmar que los gráficos corresponden al mismo análisis? Veo una relación muy débil en general: considerar si se satisfacen los supuestos del modelo para un modelo poco convincente no merece mucho tiempo. Si el modelo es bueno, que los residuos sean normales es secundario; si es pobre, la normalidad es irrelevante. También veo una cola más larga de organismos más pequeños, lo que puede reflejar una situación de mezcla, por ejemplo, conchas dañadas organismos inmaduros
0 votos
@NickCox Gracias por hacer el enlace a otro post con mi respuesta.
0 votos
Nuestras respuestas fueron antes del gráfico de regresión con los datos de dogwelk añadidos y una nueva pregunta fue añadida con él. Creo que debería haber sido un post separado. @MrGD ¿Ha añadido esto?
0 votos
También es confuso porque el segundo qqplot es para datos completamente separados del gráfico original dado por el OP.