4 votos

¿Cuál es la diferencia entre dbinom y dnorm en R?

Soy un gran novato en lo que respecta a la estadística y a R.

Estoy tratando de dar sentido a todas estas funciones como alguien que no ha tomado estadísticas antes.

En R, por lo que he entendido, con dbinom, introduces el número de ensayos, la probabilidad de éxito y un número de éxitos n, todo ello como argumentos, y te devuelve la probabilidad de que el ensayo tenga éxito n veces en un determinado número de ensayos. ¿Es esto correcto? dbinom es la función de densidad de probabilidad, ¿verdad?

Como probablemente puedas deducir, hay muchas cosas que me confunden.

En primer lugar, ¿una función de densidad de probabilidad sólo puede devolver una probabilidad distinta de cero si los datos son discretos?

pbinom es la versión acumulativa de la función de densidad de probabilidad, ¿correcto? Si los datos son continuos, utilizaría la función acumulativa, ¿verdad?

Y ahora la gran pregunta, ¿cuál es la diferencia entre dbinom/pbinom y dnorm/pnorm?

Según tengo entendido, pbinom te da esa probabilidad que mencioné al principio. Introduces un número de aciertos, un número de pruebas y una probabilidad de éxito, y te devuelve una probabilidad. Sin embargo, con dnorm, no entiendo qué es lo que introduzco. Sé que introduzco una x (que presumiblemente también representa un número de aciertos), así como una media y una desviación estándar. También sé que lo hace para una distribución normal. Lo que no entiendo es por qué no pide una probabilidad, o un número de ensayos. ¿Por qué el eje x tiene valores negativos esta vez? ¿Qué es lo que devuelve? ¿No debería devolver 0 ya que presumiblemente no es discreto? Sé que en realidad devuelve el cálculo de la ecuación (la que tiene la desviación estándar y la media), pero no sé qué representa realmente la ecuación.

Puede alguien ponerme en el camino correcto, porque me siento perdido con todos estos términos, ecuaciones y funciones.

0 votos

Bienvenido al sitio. Por favor, eche un vistazo a la documentación de R, escribiendo ?pnorm en la consola, o bien, echa un vistazo a rdocumentation.org/packages/stats/versions/3.4.3/topics/Normal .

0 votos

Gracias. La verdad es que lo he revisado bastante, pero, por desgracia, ahora soy demasiado ignorante para entender las explicaciones que se dan.

7voto

Dipstick Puntos 4869

Y ahora la gran pregunta, ¿cuál es la diferencia entre dbinom/pbinom y dnorm/pnorm?

dbinom es un función de masa de probabilidad de distribución binomial , mientras que pbinom es un función de distribución acumulativa de esta distribución. El primero le dice lo que es $\Pr(X=x)$ (probabilidad de observar un valor igual a $x$ ), mientras que la segunda, que es $\Pr(X \le x)$ (probabilidad de observar un valor menor o igual que $x$ ). Nótese que la función de distribución acumulativa no tiene nada que ver con que los datos sean continuos o discretos, hay funciones de distribución acumulativa para ambos tipos de variables (y para tipos mixtos ).

Como sobre dnorm Es una función de densidad de probabilidad Para obtener más información, consulte la página ¿Puede ser aceptable un valor de distribución de probabilidad superior a 1? hilo de rosca.

0 votos

Muchas gracias por la explicación. Sólo para aclarar algunas cosas: la función de distribución acumulativa puede ser para cualquier tipo de datos, pero la función pbinom crea una para datos discretos, ya que la distribución binomial se ocupa de variables discretas? ¿Es eso correcto?

1 votos

@user494405 La función de distribución acumulativa es un tipo de función que informa sobre las probabilidades acumulativas. La binomial, o la normal (o muchas otras) son tipos de variables aleatorias.

3voto

Alan Puntos 7273

Puedes intentar dibujarlas para ilustrarlas:

  • dnorm es una función de densidad de probabilidad por lo que el área bajo la curva (de $-\infty$ a $\infty$ ) es $1$ y las colas caen hacia $0$ . Una densidad normal puede ser a veces superior a $1$ cuando la varianza es inferior a $\frac{1}{2\pi}$

  • dbinom es una función de masa de probabilidad que toma valores positivos sólo en puntos discretos y la suma de las probabilidades es $1$ . Así que ninguna de las probabilidades individuales puede superar $1$

  • pnorm es la función de distribución acumulativa que va desde $0$ a la izquierda para $1$ a la derecha. Una distribución normal es continua y también lo es su función de distribución acumulativa

  • pbinom es la función de distribución acumulativa que va desde $0$ a la izquierda para $1$ a la derecha. Una distribución binomial es discreta, por lo que su función de distribución acumulativa salta por pasos en los valores discretos

Lo que sigue es una $N(2,\frac43)$ distribución y $Bin(6,\frac13)$ para ilustrar, ya que tienen la misma media y varianza

enter image description here

0 votos

La respuesta perfecta. No estoy seguro de si el teorema del límite central se aplica exactamente aquí, pero la idea básica es que, a medida que el espacio de la muestra se acerca al infinito, la función de distribución acumulativa para una distribución binomial se convierte efectivamente en la misma que para una distribución normal. -- Siento llegar un poco tarde a la fiesta.

2voto

Gregg H Puntos 251

Me alegro de haber aprendido este material sin haber tomado un curso de estadística (¿o probabilidad?).  Hay mucho que desempacar aquí, y puede ser mejor hacer alguna lectura externa, pero voy a empezar con una explicación de dnorm vs pnorm.

En R, dnorm() dibuja la curva que utilizaremos para calcular nuestras probabilidades.  Esta es la curva normal convencional con la que la mayoría de la gente está familiarizada.  Para calcular una probabilidad, en realidad estamos calculando un área.  En particular, vamos a cortar una línea vertical a través de esta curva, sombrear el área bajo la curva a la izquierda de la línea vertical, y este es el valor de la probabilidad.

Así, dnorm(2) da la altura de esta curva en $x=2$ mientras que pnorm(2) da el área bajo la curva de $-\infty$ a $x=2$ .

En cuanto a tu consulta sobre tener una probabilidad nula para un valor con una distribución continua... vas por buen camino.  Usando un poco de límites, si tienes pnorm(2) - pnorm(1.5), esta es el área bajo la curva de $x=1.5$ a $x=2$ .  Si empiezas a moverte $x=1.5$ más cerca de 2, esta área se convierte en cero.

Nota: he omitido términos más técnicos como función de densidad y distribución de probabilidad acumulada, pero creo que una imagen más general puede ayudar aquí.

0 votos

Muchas gracias por su respuesta. Eso aclara algunas cosas. Tengo algunas preguntas de seguimiento, si no te importa. Digamos que uso dnorm en 0. Está calculando la altura de la curva en x=0. ¿Qué representa x aquí? Además, ¿qué representa la altura de la curva? Además, si sumo todos los dbinom de x1 a x2, obtendría el equivalente a pbinom de x2, ¿no? ¿Por qué no es cierto para dnorm y pnorm? ¿Es porque son continuas? De nuevo, muchas gracias por la ayuda.

0 votos

Quise decir que tomé la suma de todos los dbinoms de 0 a x2, mis disculpas.

1voto

user3629119 Puntos 11

Una respuesta muy corta:

utilice 'dbinom' si desea conocer la probabilidad de exactamente k aciertos en N ensayos.

dos caras en 3 lanzamientos de moneda.

utilice 'pbinom' si desea conocer la probabilidad de al menos k aciertos en N ensayos. al menos dos caras en 3 lanzamientos de moneda.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X