16 votos

¿Qué son los estándares de pruebas estadísticas para ver si los datos de la siguiente manera exponencial o distribuciones normales?

¿Qué son los estándares de pruebas estadísticas para ver si los datos de la siguiente manera exponencial o distribuciones normales?

15voto

phloopy Puntos 4285

Parece que usted está tratando de decidir si un modelo de datos con la normal o la distribución exponencial. Esto parece un poco extraño para mí, ya que estas distribuciones son muy diferentes unos de otros.

La distribución normal es simétrica, mientras que la distribución exponencial es fuertemente sesgada a la derecha, sin valores negativos. Normalmente, una muestra de la distribución exponencial contiene muchas observaciones relativamente cerca de $0$, y un par de obervations que desviarse a la derecha de $0$. Esta diferencia es a menudo fácil de ver de forma gráfica.

Este es un ejemplo donde he simulado $n=100$ observaciones de una distribución normal con media de $2$ y la varianza $4$ y una distribución exponencial con una media de $2$ y la varianza $4$:

Normal vs exponential: simulated data

La simetría de la distribución normal y la asimetría de la exponencial puede ser visto usando histogramas, boxplots y diagramas de dispersión, como se ilustra en la figura anterior.

Otra herramienta muy útil es un Q-Q-plot. En el ejemplo de abajo, los puntos deben de aproximadamente seguir la línea si la muestra proviene de una distribución normal. Como se puede ver, este es el caso de la normal de datos, pero no para la exponencial de datos.

Q-Q-plots for simulated data

Si la gráfica de examen por alguna razón no es suficiente para usted, usted todavía puede utilizar una prueba para determinar si la distribución es normal o exponencial. Dado que la distribución normal es una escala y la ubicación de la familia, usted querrá usar una prueba de que es invariante bajo cambios de escala y de ubicación (es decir, el resultado de la prueba no debe cambiar si cambia sus medidas de pulgadas a centímetros o agregar $+1$ a todas sus observaciones).

Cuando la hipótesis nula es que la distribución es normal, y la hipótesis alternativa es que es exponencial, el más poderoso de localización y escala invariante de prueba está dado por la estadística de $$T_{E,N}=\frac{\bar{x}-x_{(1)}}{s}$$ donde $\bar{x}$ es la media de la muestra, $x_{(1)}$ es el más pequeño de observación en la muestra y $s$ es la desviación estándar de la muestra. La normalidad es rechazado en favor de exponentiality si $T_{E,N}$ es demasiado grande.

Este ensayo es de un solo lado de la versión de Grubbs de prueba para los valores atípicos. Usted encontrará esta implementado en la mayoría de los programas estadísticos (pero asegúrese de que utiliza la versión correcta, hay varias alternativas de pruebas estadísticas utilizadas para el outlier prueba!).

De referencia para$T_{E,N}$, siendo el más potente de la prueba: la Sección 4.2.4 de las Pruebas de Normalidad por H. C. Thode.

7voto

user10479 Puntos 395

Para la distribución exponencial, se puede utilizar una prueba llamada Moran o Bartlett en la prueba. La prueba estadística de $B_n$ implica la media de la muestra $\overline{Y}$ así como la media de la muestra $\overline{\log Y}$ de la registra $Y_i$ $$ B_n = b_n \times \left\{\log \bar{Y} - \overline{\log Y} \right\} \qquad b_n = 2n \times \left\{1+ (n+1)/(6n) \right\}^{-1} $$ Bajo la hipótesis nula tenemos aproximadamente $B_n \sim \chi^2(n-1)$ y una prueba de dos caras de obras. Esta prueba está diseñada contra gamma alternativas.

Ver K. C. Kapur y L. R. Lamberson Fiabilidad en el diseño de ingeniería. Wiley 1977.

5voto

mat_geek Puntos 1367

De normalidad de Anderson-Darling y de Shapiro-Wilk se considera la mejor. Para la exponencial Lillerfors prueba está diseñada específicamente para ello.

4voto

Gant Puntos 9920

Han considerado que la gráfica de métodos para ver cómo los datos se comporta?

Probabilidad gráfico técnicas generalmente implica la clasificación de los datos, la aplicación de la inversa de la CDF y, a continuación, trazando los resultados en el plano Cartesiano. Esto permite que usted para ver si hay varios valores que se desvían de la hipótesis de la distribución y, posiblemente, de la cuenta de la razón de la desviación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X