4 votos

Distribución de la varianza de la muestra de normales independientes pero no idénticamente distribuidas

Cuando estoy leyendo la página de Wikipedia sobre la distribución chi-cuadrado, se afirma que si $X_1, \ldots, X_n$ son $\text{N}(\mu, \sigma^2)$, entonces $\sum^n_{i=1} (X_i - \bar{X})^2 \sim \sigma^2 \chi^2_{n-1}$ donde $\bar{X} = \frac{1}{n} \sum^n_{i=1} X_i$ es la media de la muestra.

Me pregunto si un resultado similar se cumple cuando no asumimos que las varianzas son iguales, es decir, cuando $X_i \sim \text{N}(\mu, \sigma_i^2)$ ---es decir, si deberíamos tener algo como

$$\sum^n_{i=1} (X_i - \bar{X})^2 = \text{(alguna combinación de } \sigma_i^2 \text{)} \times \chi_{n-1}^2.$$

Tengo la sensación de que debería ser así, pero no puedo encontrar una prueba al respecto.

1voto

Aaron Puntos 36

Puedes encontrar un resultado general sobre la forma cuadrática de un vector normal aleatorio en esta pregunta relacionada. En el caso en que las variables aleatorias normales son independientes con media común pero varianzas diferentes, la forma cuadrática será una suma ponderada de variables aleatorias chi-cuadrado uno:


Para las variables aleatorias especificadas en tu pregunta, puedes agruparlas en el vector normal aleatorio:

$$\mathbf{X} \sim \text{N}(\mu \mathbf{1}, \boldsymbol{\Sigma}) \quad \quad \quad \quad \quad \boldsymbol{\Sigma} = \text{diag}(\sigma_1^2,...,\sigma_n^2).$$

Usando la matriz de centrado $\mathbf{C}$ tenemos que $\mathbf{X} - \bar{\mathbf{X}} = \mathbf{C} \mathbf{X}$. Además, es sencillo mostrar que la matriz $\mathbf{C}$ es simétrica e idempotente, por lo que $\mathbf{C}^\text{T} \mathbf{C} = \mathbf{C}$. (Para información detallada sobre la matriz de centrado, ver por ejemplo, O'Neill 2020, esp. secciones 3-4.) Para este análisis también voy a usar el vector aleatorio normal estándar $\mathbf{Z} \sim \text{N}(\mathbf{0}, \mathbf{I})$. Usando estos objetos, podemos escribir la forma cuadrática de interés como:

$$\begin{align} \sum_{i=1}^n (X_i - \bar{X})^2 &= (\mathbf{X} - \bar{\mathbf{X}})^\text{T} (\mathbf{X} - \bar{\mathbf{X}}) \\[6pt] &= (\mathbf{C} \mathbf{X})^\text{T} (\mathbf{C} \mathbf{X}) \\[6pt] &= \mathbf{X}^\text{T} \mathbf{C}^\text{T} \mathbf{C} \mathbf{X} \\[6pt] &= \mathbf{X}^\text{T} \mathbf{C} \mathbf{X} \\[6pt] &= (\mathbf{X} - \mu \mathbf{1})^\text{T} \mathbf{C} (\mathbf{X} - \mu \mathbf{1}) \\[6pt] &= (\boldsymbol{\Sigma}^{1/2} \mathbf{Z})^\text{T} \mathbf{C} (\boldsymbol{\Sigma}^{1/2} \mathbf{Z}) \\[6pt] &= \mathbf{Z}^\text{T} \boldsymbol{\Sigma}^{1/2} \mathbf{C} \boldsymbol{\Sigma}^{1/2} \mathbf{Z} \\[6pt] &\sim \sum_{i=1}^n \lambda_i \cdot \chi_1^2, \end{align}$$

donde $\lambda_1,...,\lambda_n$ son los autovalores de la matriz $\boldsymbol{\Sigma}^{1/2} \mathbf{C} \boldsymbol{\Sigma}^{1/2}$. Esta última matriz viene dada por:

$$\begin{align} \boldsymbol{\Sigma}^{1/2} \mathbf{C} \boldsymbol{\Sigma}^{1/2} &= \text{diag}(\sigma_1,...\sigma_n) \ \mathbf{C} \ \text{diag}(\sigma_1,...\sigma_n) \\[6pt] &= \begin{bmatrix} \tfrac{n-1}{n} \sigma_1^2 & -\tfrac{1}{n} \sigma_1 \sigma_2 & \cdots & -\tfrac{1}{n} \sigma_1 \sigma_n \\ -\tfrac{1}{n} \sigma_1 \sigma_2 & \tfrac{n-1}{n} \sigma_2^2 & \cdots & -\tfrac{1}{n} \sigma_2 \sigma_n \\ \vdots & \vdots & \ddots & \vdots \\ -\tfrac{1}{n} \sigma_1 \sigma_n & -\tfrac{1}{n} \sigma_2 \sigma_n & \cdots & \tfrac{n-1}{n} \sigma_n^2 \\ \end{bmatrix}. \\[6pt] \end{align}$$

Puedes tomar la forma matricial anterior y usarla para calcular los autovalores $\lambda_1,...,\lambda_n$ para tus valores de desviación estándar $\sigma_1,...,\sigma_n$. Esto te dará los pesos para la suma ponderada de variables aleatorias chi-cuadrado uno.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X