20 votos

¿Diferencia entre histograma y pdf?

Si queremos ver la distribución de un dato continuo de forma visible, ¿cuál de los dos debe utilizarse, el histograma y el pdf?

¿Cuáles son las diferencias, no de fórmula, entre el histograma y el pdf?

24voto

J Wynia Puntos 4679

Para aclarar el punto de Dirks :

Digamos que tus datos son una muestra de una distribución normal. Podrías construir el siguiente gráfico:

alt text

La línea roja es la estimación de la densidad empírica, la línea azul es la pdf teórica de la distribución normal subyacente. Obsérvese que el histograma se expresa aquí en densidades y no en frecuencias. Esto se hace con fines de trazado, en general se utilizan las frecuencias en los histogramas.

Así que para responder a su pregunta: se utiliza la distribución empírica (es decir, el histograma) si se quiere describir la muestra, y el pdf si se quiere describir la distribución subyacente hipotética.

El gráfico se genera con el siguiente código en R :

x <- rnorm(100)
y <- seq(-4,4,length.out=200)

hist(x,freq=F,ylim=c(0,0.5))
lines(density(x),col="red",lwd=2)
lines(y,dnorm(y),col="blue",lwd=2)

13voto

Jay Puntos 395

Un histograma es la estimación de una densidad antes de la edad de los ordenadores. Una estimación de la densidad es una alternativa.

Hoy en día utilizamos ambos, y existe una rica literatura sobre los valores por defecto que se deben utilizar.

Por otro lado, un pdf es una expresión de forma cerrada para un dado distribución. Esto es diferente de describir su conjunto de datos con un estimado densidad o histograma.

6voto

Omar Kooheji Puntos 384

Anillos y álgebras matemáticas

  • El algoritmo Pagerank de Google se basa, en parte, en la descomposición del valor singular.
  • El análisis/transformación de Fourier y el álgebra lineal actúan en el mundo millones de veces por segundo (vídeo, audio). En particular, crear o mostrar una imagen JPEG requiere la transformada discreta de Fourier.
  • Los cuaterniones se utilizan en el software de modelado y animación 3D para representar las rotaciones de una forma más sólida que los ángulos de Euler (lo que ayuda a evitar problemas de transición como el bloqueo del cardán).
  • Toda simulación con el método de los elementos finitos utiliza el álgebra de forma muy extensa. manera.

1voto

Histograma de frecuencia relativa ( discreto )

  • El eje 'y' es el recuento normalizado
  • El eje "y" es la probabilidad discreta para esa casilla/rango en particular
  • Los recuentos normalizados suman 1

Histograma de densidad ( discreto )

  • El eje "y" es el valor de la densidad ("recuento normalizado" dividido por el "ancho de la bandeja")
  • Las áreas de las barras suman 1

Función de densidad de probabilidad PDF ( continuo )

  • El PDF es una versión continua de un histograma, ya que las franjas del histograma son discretas
  • el área total bajo la curva se integra en 1

Estas referencias fueron útiles :) http://stattrek.com/statistics/dictionary.aspx?definition=Probability_density_function

Distribución_de_probabilidad_continua de la página web mencionada

http://www.geog.ucsb.edu/~joel/g210_w07/lecture_notes/lect04/oh07_04_1.html

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X