Intento aproximar una distribución normal estándar con una distribución triangular. ¿Qué parámetros de la distribución triangular (mínimo, máximo y moda) son más adecuados? Gracias
Respuestas
¿Demasiados anuncios?La mejor aproximación en el $L^2$ sentido viene dado por el valor de $\alpha\in\mathbb{R}^+$ para lo cual:
$$ \frac{d}{d\alpha}\left(\frac{1}{2\pi}\int_{|x|\geq \alpha}e^{-x^2}\,dx + \int_{-\alpha}^{\alpha}\left(\frac{1-|x/\alpha|}{\alpha}-\frac{e^{-x^2/2}}{\sqrt{2\pi}}\right)^2\,dx\right)=0,$$ es decir, minimizando el $L^2$ norma de la diferencia entre la pdf de una distribución normal estándar, $\frac{1}{\sqrt{2\pi}}e^{-x^2/2}$ y una distribución apoyada en $[-\alpha,\alpha]$ tener pdf $\frac{1}{\alpha}\left(1-\left|\frac{x}{\alpha}\right|\right).$
Numéricamente, es $\color{red}{\alpha\approx 2.297}$ . Aquí están las dos distribuciones:
Depende de en qué sentido quieras que tu distribución triangular se "aproxime" a la distribución normal. La distribución normal es simétrica respecto a $0$ y unimodal, por lo que probablemente quiera que su distribución triangular sea simétrica respecto a $0$ y también unimodal. Para que la distribución triangular sea una distribución de probabilidad, el área bajo el triángulo debe ser $1$ . Si su triángulo tiene altura $h$ y la base $b$ Esto significa que $bh/2=1$ Así que $b=2/h$ . Por lo tanto, tiene un parámetro más que fijar para aproximarse lo mejor posible a una distribución normal.
Una siguiente cosa razonable a pedir sería que su distribución triangular y la distribución normal estándar tengan la misma varianza; es decir, que su distribución triangular tenga varianza $1$ . La pdf de su distribución viene dada por
$$f(x)=\left(1-\frac{2}{b}|x|\right)h=(1-h|x|)h.$$
Así, la varianza de su distribución triangular con altura $h$ y la base $2/h$ será
$$\text{Var} = \int_{-1/h}^{1/h}x^2\cdot (1-h|x|)h \, dx =2\int_0^{1/h}x^2\cdot \left(1-hx\right)h \, dx;$$
entonces todo lo que tienes que hacer es resolver para $h$ .
De su Distribución Triangular tiene un (mínimo), un (máximo) y un (modo).
en una Distribución Normal se tiene una (media) y una (desviación estándar) abreviada como (sd) . en la Distribución Normal la (media) es igual a la (moda) debido a la simetría del modelo.
para pasar de un modelo triangular a un modelo normal necesitamos estimar la (media) y la (desviación estándar) de los parámetros del modelo triangular
para la (media):
es razonable utilizar su (moda) de la Distribución Triangular como su (media) para su Distribución Normal porque son iguales bajo el modelo Normal. NOTA en este punto uno debe ser consciente de que tal vez romper un supuesto de simetría en su modelo normal.
una segunda estimación razonable para la (media) puede venir del (punto medio) del (mínimo) y el (máximo) donde (punto medio)=((máximo)-(mínimo))/2.
la (media) de la distribución Normal representa la tendencia central. a (punto medio) y a (moda) son también medidas de tendencia central por lo que son candidatos que tenemos fácilmente disponibles de la Distribución Triangular.
un tercer método será utilizar la (media) de la distribución triangular y utilizarla para estimar la media de una distribución normal. la (media) de una distribución triangular es (mean_tri)=((min)+(max)+(mode))/3
método 1 (tendencia central):
(media)=(moda)
o
método 2 (tendencia central):
(punto medio)=((máx)-(mín))/2
(media)=(punto medio)
o
método 3 (momentos de partido):
(media_tri)=((min)+(max)+(mode))/3
(media)=(media_tri)
para la (desviación estándar):
una distribución triangular nos da un (mínimo) y un (máximo). Podemos tomar la diferencia para encontrar un valor de rango (rango)=(máx)-(mín). una función del rango puede proporcionar una estimación de la desviación estándar de una distribución Normal f(rango)=(sd). Depende del usuario determinar una función razonable en este punto. ejemplo: una desviación estándar de cuatro cubre el 95% de los datos de una Distribución Normal y resultaría en una estimación de la desviación estándar de (sd)=(rango)/4, mientras que un rango de seis desviaciones estándar cubre el 99% y resultaría en una estimación de (sd)=(rango)/6.
Otro método será tomar la (desviación estándar) de la Distribución Triangular y usarla para estimar la (distribución estándar) de la Distribución Normal. la (sd) de una distribución triangular es (sd_tri)=sqrt(((min)^2+(max)^2+(mode)^2-(min)(max)-(min)(mode)-(max)(mode))/18)
método 1 (cobertura de la gama):
intente establecer
(rango)=(máximo)-(mínimo)
y usando:
(sd)=(rango)/2 (65% de cobertura normal) (el más gordo de los tres modelos)
o
(sd)=(rango)/4 (cobertura normal del 95%) (ancho medio de los tres modelos)
o
(sd)=(rango)/6 (cobertura normal del 99%) (el más delgado de los tres modelos)
método 2 (coincidir con los momentos centrales):
(sd_tri)=sqrt(((min)^2+(max)^2+(mode)^2-(min)(max)-(min)(mode)-(max)(mode))/18)
(sd)=(sd_tri)
Al estimar la (media) y la (desviación estándar), puede considerar el grado de confianza que tenía en la cobertura de la población por parte de su Triángulo y si la distribución original estaba sesgada. ¿Los valores (mínimo) y (máximo) son el resultado de una muestra muy pequeña o de una muestra muy grande? Si es asimétrica, ¿quiere centrarse en la moda o quiere ir a por más cobertura?