1 votos

¿cómo registrar una función de distribución empírica?

Digamos que tengo los números $$ 15, 10, 2, 3 ,1, 0 ,4, 5, 5,3,3,4,2,1,4,5$$

Según tengo entendido, debemos dejar que y oscile entre 0 y 1 con $\frac{1}{16}$ intervalos. Pero no sé cómo funcionaría el eje x ya que parece que hay múltiplos del mismo número.

1voto

Parece que debe representar gráficamente la función de distribución acumulativa de una PDF discreta basada en 16 muestras escasas.

Habrá un salto en el gráfico de $\frac{1}{16}$ en $x=0$ porque sólo hay una $0$ .

Habrá un salto en el gráfico de $\frac{2}{16}$ en $x=1$ y $x=2$ porque hay dos $1$ s y dos $2$ s.

Habrá un salto de $\frac{3}{16}$ en $x=3,\,4\,5$ etc.

La función tendrá el siguiente aspecto (he escalado el $x$ -eje para comprimir el gráfico horizontalmente y sombrear la región debajo del gráfico).

Cumulative Distribution

1voto

BruceET Puntos 7117

Aquí están sus $n = 16$ observaciones enumeradas por orden:

x = sort(c(15, 10, 2, 3 ,1, 0, 4, 5, 5, 3, 3, 4, 2, 1, 4, 5))
x
[1]  0  1  1  2  2  3  3  3  4  4  4  5  5  5 10 15

Es cierto que algunos valores se repiten. He aquí una tabulación:

table(x)
x
 0  1  2  3  4  5 10 15 
 1  2  2  3  3  3  1  1 

Sólo hay ocho valores diferentes (todos enteros) entre los 16. Así que su ECDF tendrá ocho puntos de salto, con saltos de diferentes tamaños. Cada salto será un múltiplo de $1/16.$

A continuación se muestra un gráfico de la ECDF del software estadístico R. Usted no la definición formal de ECDF de tu libro, así que dejaré que coincida con la definición con la trama y proporcionar cualquier explicación es necesaria.

plot(ecdf(x))

enter image description here

Notas: Un gráfico de probabilidad normal (con los datos en el eje horizontal) puede verse como una versión de la ECDF con el eje vertical vertical distorsionado de forma que los puntos queden aproximadamente a lo largo de una línea recta, siempre que los datos se tomen aleatoriamente de una distribución normal.

qqnorm(x, datax=T);  qqline(x, datax=T)

enter image description here

Para sus datos, algunos de los puntos se encuentran cerca de una línea recta, pero dos de los puntos se alejan considerablemente de la recta. Esto puede indicar que la muestra no procede de una distribución normal. De hecho, la prueba de normalidad de Shapiro-Wilk muestra un valor P pequeño, lo que vuelve a poner en duda la normalidad de los datos.

shapiro.test(x)

        Shapiro-Wilk normality test

data:  x
W = 0.79524, p-value = 0.002356

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X