5 votos

Lo de distribución a utilizar para esta QQ plot?

Tengo un conjunto de datos y me hizo el QQ-plot en contra de la $N(0,1)$ distribución. La parcela está incluida a continuación.

Mis estadísticas es oxidada por decir lo menos (o sea lo que el poco conocimiento que había ahora es oxidado!) Claramente la distribución normal no es un buen ajuste -- las colas en mis datos son más pesados que los de una distribución normal. Pero los datos no parece estar sesgada en relación a la distribución normal.

Es así, que la distribución podría ser un mejor ajuste? Es algo de una transformación Box-Cox podría curar para que se ajuste mejor?

Editar:

Mis datos no es estrictamente positivo de Box-Cox es... Pero no puede ser otra transformación que funciona.

Edit 2:

Tengo cada vez más en grandes conjuntos de datos y necesito ver lo que, en todo caso, los conjuntos de datos convergen. Este es el análisis de exploración, más bien me gustaría encontrar una distribución que se ajusta a los datos en lugar de la transformación de los datos a una distribución. Todo esto se hace con SciPy el cual informa sobre el valor asintótico de la sesgada de la curtosis como -1 y la asimetría como 0.

Pero no sé cómo se usa esta información para determinar que la distribución de esta, podría ser, aparte de la comprobación de todos ellos a ver que te dan una mejor $r^2$.

Edit 3:

Basado en un comentario de gung, lo he comprobado en contra de una distribución uniforme:

Efectivamente, eso es mucho mejor, aunque todavía muestra una diferencia en las colas.

7voto

Sean Hanley Puntos 2428

Me pasaré mis comentarios en una respuesta; puedo eliminar este o agregar más si es necesario.

Basado en el original qq-plot, a mí me parece que las colas de la distribución puede ser demasiado corto, al menos en relación a la distribución normal. (Esto se basa en mi interpretación de que los valores de los datos están en el eje Y "Valores Ordenados" y los cuantiles teóricos están en el eje X.) Como resultado de esto, la evidente simetría, y la ligera inclinación en el medio, me preguntaba si podría ser una distribución uniforme o algo similar. He hablado de la interpretación de q-parcelas aquí: qq-plot no coincide con el histograma.

Edit 2 señaló que la curtosis fue dado como $-1$. Me gusta este recurso para pensar acerca de la curtosis, que señala que la curtosis no puede ser inferior a $1$, por lo tanto SciPy ha dado el exceso de curtosis (que es la curtosis - 3). La página de Wikipedia para la curtosis de las listas de la curtosis de la distribución uniforme como $-1$, lo cual es consistente con mi conjetura sobre el qq-plot.

Edición 3 puestos de un qq-plot contra el uniforme, la cual se ajusta bastante bien, pero las colas que ahora parecen un poco demasiado pesado. Vale la pena señalar que la distribución uniforme es en realidad un caso especial de la distribución beta donde los parámetros se $(1,1)$. Por lo tanto, es posible que tenga una beta que está muy cerca de a (1,1), pero no en realidad bastante (1,1) (es decir, no del todo uniforme). Algo como $(.9, .9)$, podría servir como una estimación inicial. Por supuesto, la validez de esta suposición depende de la cantidad de datos que se tiene en cuanto a si esa ligera divergencia es confiable. Usted puede leer más acerca de la distribución beta en este excelente hilo: ¿cuál-es-la intuición-detrás-beta-distribución.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X