Supongamos que tengo un proceso generativo que produce muestras de datos de la siguiente manera:
- a) Hay una cantidad predeterminada $m$ de "ranuras" con probabilidades asociadas que suman 1. Estas son dadas y no aleatorias.
- b) Una muestra de números se extrae uniformemente al azar $\sim \mathrm{Unif}(0, 1)$ para cada una de las ranuras del paso
a)
. - c) Se extrae una cantidad indefinida de números a partir de una función de masa de probabilidad discreta que toma muestras de los números que se determinaron en
b)
con las probabilidades asociadas dadas en el pasoa)
.
Si me dan los coeficientes del paso a)
y, a continuación, empezar a construir diferentes muestras siguiendo b)
y c)
y tomar la varianza y la curtosis de esas muestras, ¿cómo puede el esperado ¿se pueden expresar la varianza y la curtosis en términos de los coeficientes dados en a)?
(Varianza y curtosis esperadas de una muestra resultante extraída en el paso c)
dado que el paso b)
también debe repetirse)
La varianza viene dada por $\mathrm{Var}[x] = E[x^2] – E^2[x]$ mientras que la curtosis viene dada por $$\kappa(x) = E\left[ \Bigl(\frac{x - \bar{x}}{\sqrt{\mathrm{Var}[x]}} \Bigr)^4 \right]~,$$ o bien $\mathrm{Var}[z^2]+1$ (donde $z$ es el valor normalizado de $x$ obtenido restando la media y dividiendo por la desviación estándar: $Z = \dfrac{x - \bar{x}}{\sqrt{\mathrm{Var}[x]}}$ y $\bar{x}$ denota la media).
El problema sería muy fácil sin el paso b)
Es decir, $V(x) = \sum_{i=1}^{m} p_i m_i^2 - \left( \sum_{i=1}^{m} p_i m_i \right)^2$ pero me pregunto cómo podría resolverse así.