1 votos

Varianza y curtosis esperadas del PMF en el que los posibles valores discretos se extraen aleatoriamente por adelantado

Supongamos que tengo un proceso generativo que produce muestras de datos de la siguiente manera:

  • a) Hay una cantidad predeterminada $m$ de "ranuras" con probabilidades asociadas que suman 1. Estas son dadas y no aleatorias.
  • b) Una muestra de números se extrae uniformemente al azar $\sim \mathrm{Unif}(0, 1)$ para cada una de las ranuras del paso a) .
  • c) Se extrae una cantidad indefinida de números a partir de una función de masa de probabilidad discreta que toma muestras de los números que se determinaron en b) con las probabilidades asociadas dadas en el paso a) .

Si me dan los coeficientes del paso a) y, a continuación, empezar a construir diferentes muestras siguiendo b) y c) y tomar la varianza y la curtosis de esas muestras, ¿cómo puede el esperado ¿se pueden expresar la varianza y la curtosis en términos de los coeficientes dados en a)?

(Varianza y curtosis esperadas de una muestra resultante extraída en el paso c) dado que el paso b) también debe repetirse)

La varianza viene dada por $\mathrm{Var}[x] = E[x^2] – E^2[x]$ mientras que la curtosis viene dada por $$\kappa(x) = E\left[ \Bigl(\frac{x - \bar{x}}{\sqrt{\mathrm{Var}[x]}} \Bigr)^4 \right]~,$$ o bien $\mathrm{Var}[z^2]+1$ (donde $z$ es el valor normalizado de $x$ obtenido restando la media y dividiendo por la desviación estándar: $Z = \dfrac{x - \bar{x}}{\sqrt{\mathrm{Var}[x]}}$ y $\bar{x}$ denota la media).

El problema sería muy fácil sin el paso b) Es decir, $V(x) = \sum_{i=1}^{m} p_i m_i^2 - \left( \sum_{i=1}^{m} p_i m_i \right)^2$ pero me pregunto cómo podría resolverse así.

1voto

James Tait Puntos 11

Me responderé a mí mismo después de jugar con el software para las matemáticas simbólicas.

Para la curtosis: no parece haber una forma de expresarla de forma sencilla en términos de los coeficientes iniciales.

Para la varianza, suponiendo que $m$ ranuras, se puede obtener recursivamente asumiendo que la varianza ya está calculada con una ranura omitida $$ E[\text{Var}_m(x)] = E[\text{Var}_{m-1}(x)] - \sum_{i=1}^{m-1}\frac{p_i p_m}{2} - \frac{p_m^2}{3} + \frac{p_m}{3} $$

Con $$ E[\text{Var}_2(x)] = - \frac{p_1^2}{3} - \frac{p_1 p_2}{2} + \frac{p_1}{3} - \frac{p_2^2}{3} + \frac{p_2}{3} $$

Ejemplo de código python:

def Evar(p):
    ### p is a numpy array
    n = p.shape[0]
    r = -p[0]**2/3 - p[0]*p[1]/2 + p[0]/3 - p[1]**2/3 + p[1]/3
    for i in range(2, n):
        for j in range(i):
            r -= p[j] * p[i] / 2
        r += p[i] / 3 - p[i]**2 / 3
    return r

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X