Tengo una función de distribución empírica: Y necesito calcular la altura de cada uno de los bins[0,1], (1,3], (3,5], (5,8], (8,11], (11,14], y (14,18]. La fórmula para obtener la altura es (nº de elementos en la bandeja)/(nº de elementos totales)*(anchura de la bandeja). Mi pregunta es: ¿cómo puedo saber cuántos elementos hay en la bandeja y cuántos elementos hay en total si sólo tengo en cuenta la función de distribución empírica?
Respuesta
¿Demasiados anuncios?Se puede hacer un histograma de "densidad", pero no uno que muestre las frecuencias reales. Tiene 8 límites de intervalo (puntos de corte) y, por tanto, 7 barras de histograma. A partir de sus frecuencias relativas acumuladas, puede obtener las frecuencias relativas frecuencias relativas de los 7 intervalos (bins): 0.125, 0.120, 0.170, 0.220, 0.070, 0.105, 0.190.
La frecuencia relativa de una casilla es (nº en la casilla)/(nº total en la muestra). Como ha observado, no conoce ni el numerador ni el denominador. Sin embargo conoce el 7 ratios por sustracción como en el último párrafo.
Normalmente, no es una buena práctica utilizar anchos de recipiente desiguales a menos que que haya una buena razón (como una distribución muy sesgada). Pero éste es un ejercicio sobre cómo tratar con anchuras de cajón desiguales. Sólo tiene que encontrar los 7 anchos de recipiente y puede terminar el problema.
Adenda: Cuando hayas terminado, el área total de todas las barras del histograma debe ser 1: $$ \sum A_i = \sum w_ih_i = \sum w_i(r_i/w_i) = \sum r_i = 1,$$ eran sumas de todos los contenedores, $A_i$ es zona de bar, $w_i$ es la anchura del contenedor, $h_i$ es la altura de la barra, y $r_i$ es la frecuencia relativa del contenedor. El eje vertical de un histograma de "densidad" (con anchuras desiguales) debe denominarse "Densidad" (no "frecuencia relativa").