22 votos

Estadísticas suficientes y completas para la uniformidad $(a, b)$ Distribuciones

Sea $\mathbf{X}= (x_1, x_2, \dots x_n)$ sea una muestra aleatoria de la distribución uniforme en $(a,b)$ donde $a < b$ . Sea $Y_1$ y $Y_n$ sean los estadísticos de orden mayor y menor. Demuestre que el estadístico $(Y_1, Y_n)$ es una estadística suficiente y completa para el parámetro $\theta = (a, b)$ .

No me supone ningún problema demostrar la suficiencia utilizando la factorización.

Pregunta: ¿Cómo se demuestra la exhaustividad? Preferiblemente me gustaría una pista.

Intento: Puedo mostrar $\mathbb E[g(T(x))] = 0$ implica $g(T(x)) = 0$ para la distribución uniforme de un parámetro, pero me estoy atascando en la distribución uniforme de dos parámetros.

He intentado jugar con $\mathbb E[g(Y_1, Y_n)]$ y utilizando la distribución conjunta de $Y_1$ y $Y_n$ pero no estoy seguro de ir en la dirección correcta, ya que el cálculo me hace tropezar.

11voto

jldugger Puntos 7490

Vamos a ocuparnos del cálculo rutinario por ti, para que puedas llegar al meollo del problema y disfrutar formulando una solución. Se trata de construir rectángulos como uniones y diferencias de triángulos.

En primer lugar, elija valores de $a$ y $b$ que simplifican al máximo los detalles. Me gusta $a=0,b=1$ la densidad univariante de cualquier componente de $X=(X_1,X_2,\ldots,X_n)$ no es más que la función indicadora del intervalo $[0,1]$ .

Busquemos la función de distribución $F$ de $(Y_1,Y_n)$ . Por definición, para cualquier número real $y_1 \le y_n$ esto es

$$F(y_1,y_n) = \Pr(Y_1\le y_1\text{ and } Y_n \le y_n).\tag{1}$$

Los valores de $F$ son obviamente $0$ ou $1$ en caso de que $y_1$ ou $y_n$ está fuera del intervalo $[a,b] = [0,1]$ así que asumamos que ambos están en este intervalo. (Supongamos también que $n\ge 2$ para evitar hablar de trivialidades). En este caso, el acontecimiento $(1)$ puede describirse en términos de las variables originales $X=(X_1,X_2,\ldots,X_n)$ como "al menos uno de los $X_i$ es menor o igual que $y_1$ y ninguno de los $X_i$ superar $y_n$ ." Equivalentemente, todos los $X_i$ mentir en $[0,y_n]$ pero no todos ellos se encuentran en $(y_1,y_n]$ .

Porque el $X_i$ son independientes, sus probabilidades se multiplican y dan $(y_n-0)^n = y_n^n$ y $(y_n-y_1)^n$ respectivamente, para estos dos acontecimientos que acabamos de mencionar. Así pues,

$$F(y_1,y_n) = y_n^n - (y_n-y_1)^n.$$

La densidad $f$ es la derivada parcial mixta de $F$ ,

$$f(y_1,y_n) = \frac{\partial^2 F}{\partial y_1 \partial y_n}(y_1,y_n) = n(n-1)(y_n-y_1)^{n-2}.$$

El caso general de $(a,b)$ escala las variables por el factor $b-a$ y desplaza la ubicación en $a$ . Así, para $a \lt y_1 \le y_n \lt b$ ,

$$F(y_1,y_n; a,b) = \left(\left(\frac{y_n-a}{b-a}\right)^n - \left(\frac{y_n-a}{b-a} - \frac{y_1-a}{b-a}\right)^n\right) = \frac{(y_n-a)^n - (y_n-y_1)^n}{(b-a)^n}.$$

Diferenciando como antes obtenemos

$$f(y_1,y_n; a,b) = \frac{n(n-1)}{(b-a)^n}(y_n-y_1)^{n-2}.$$

Considere la definición de exhaustividad. Sea $g$ sea cualquier función medible de dos variables reales. Por definición,

$$\eqalign{E[g(Y_1,Y_n)] &= \int_{y_1}^b\int_a^b g(y_1,y_n) f(y_1,y_n)dy_1dy_n\\ &\propto\int_{y_1}^b\int_a^b g(y_1,y_n) (y_n-y_1)^{n-2} dy_1dy_n.\tag{2} }$$

Tenemos que demostrar que cuando esta expectativa es cero para todo $(a,b)$ entonces es seguro que $g=0$ para cualquier $(a,b)$ .

Aquí tienes una pista. Sea $h:\mathbb{R}^2\to \mathbb{R}$ sea cualquier función mensurable. Me gustaría expresarlo en la forma sugerida por $(2)$ como $h(x,y)=g(x,y)(y-x)^{n-2}$ . Para ello, obviamente debemos dividir $h$ par $(y-x)^{n-2}$ . Desgraciadamente, para $n\gt 2$ esto no se define siempre que $y=x$ . La clave es que este conjunto tiene medida cero por lo que podemos despreciarlo.

En consecuencia, dado cualquier medible $h$ definir

$$g(x,y) = \left\{\matrix{h(x,y)/(y-x)^{n-2} & x \ne y \\ 0 & x=y}\right.$$

Entonces $(2)$ se convierte en

$$\int_{y_1}^b\int_a^b h(y_1,y_n) dy_1dy_n \propto E[g(Y_1,Y_n)].\tag{3}$$

(Cuando la tarea consiste en demostrar que algo es cero, podemos ignorar las constantes de proporcionalidad distintas de cero. En este caso, he omitido $n(n-1)/(b-a)^{n-2}$ de la izquierda).

Se trata de una integral sobre un triángulo rectángulo cuya hipotenusa se extiende desde $(a,a)$ a $(b,b)$ y vértice en $(a,b)$ . Denotemos tal triángulo $\Delta(a,b)$ .

Ergo , lo que tienes que demostrar es que si la integral de una función arbitraria medible $h$ en todos triángulos $\Delta(a,b)$ es cero, entonces para cualquier $a\lt b$ , $h(x,y)=0$ (casi seguro) para todos $(x,y)\in \Delta(a,b)$ .

Aunque pueda parecer que no hemos llegado más lejos, consideremos cualquier rectángulo $[u_1,u_2]\times [v_1,v_2]$ totalmente contenido en el semiplano $y \gt x$ . Puede expresarse en términos de triángulos:

$$[u_1,u_2]\times [v_1,v_2] = \Delta(u_1,v_2) \setminus\left(\Delta(u_1,v_1) \cup \Delta(u_2,v_2)\right)\cup \Delta(u_2,v_1).$$

Figure showing the three triangles overlapping to produce the rectangle

En esta figura, el rectángulo es lo que queda del triángulo grande cuando quitamos los triángulos rojo y verde superpuestos (que cuentan doble su intersección marrón) y luego sustituimos su intersección.

En consecuencia, se puede deducir inmediatamente que la integral de $h$ sobre todos esos rectángulos es cero. Sólo queda demostrar que $h(x,y)$ debe ser cero (aparte de sus valores en algún conjunto de medida cero) siempre que $y \gt x$ . La prueba de esta afirmación (intuitivamente clara) depende del enfoque que se quiera dar a la definición de integración.

1voto

Qiu Li Puntos 1

Siguiendo la respuesta de @whuber, tenemos la densidad conjunta de $(Y_{(1)},Y_{(n)})$ $$f(y_1, y_n,a,b)=\frac{n(n-1)}{(b-a)^n}(y_n-y_1)^{n-1},\quad\forall a\leq y_1\leq y_n\leq b\text{ and }a,b\in\mathbb{R}$$

Para cualquier función $g(x_1,x_n)$ para que $\mathbb{E}_{a,b}\left[g(y_1,y_n)\right]=0,\forall a,b\in\mathbb{R}\text{ and }a<b$ tenemos $$0=\frac{n(n-1)}{(b-a)^n}\int_{a}^{b}\int_{a}^{y_n}g(y_1,y_n)(y_n-y_1)^{n-2} dy_1dy_n,\forall a,b\in\mathbb{R}\text{ and }a<b.$$ El área integral de $(y_1, y_n)$ es un triángulo con vértices $(a,a)$ , $(a,b)$ y $(b,b)$ . Con diferentes $a\in\mathbb{R}$ $b\in\mathbb{R}$ $a<b$ estos triángulos generan el Borel $\sigma$ -de $\mathcal{B}=\{(x,z)\in\mathbb{R}^2:x\leq z\}$ . Así $$0=\frac{n(n-1)}{(b-a)^n}\int_{A}g(y_1,y_n)(y_n-y_1)^{n-2} d(y_1,y_n),\text{ for any Borel set }A\subset\mathcal{B}.$$ Es decir $$g(y_1,y_n)(y_n-y_1)^{n-2}\equiv0,a.e.\iff g\equiv 0,a.e.$$ Así pues, concluimos $(Y_{(1)},Y_{(n)})$ es una estadística completa para $(a,b).$

1voto

Maxime Puntos 322

Creo que vale la pena elaborar un poco el paso de cómo llegar a $g = 0$ a.e. $\lambda$ de la ecuación integral en la respuesta de @Tan y @whuber, ya que demuestra algunas técnicas clásicas de la teoría de la medida que podrían ser utilizadas en otros problemas similares de prueba de completitud.

Denote $g(x, y)(y - x)^{n - 2}$ par $f(x, y)$ entonces la respuesta de Tan demostró que \begin{align} \int_a^b\int_a^y f(x, y)dxdy = 0\; \text{ for all } a < b. \tag{1} \end{align}

el inteligente argumento geométrico de Whuber muestra que $(1)$ implica que \begin{align} \int_I f(x, y)dxdy = 0\; \text{ for all } I \in \mathscr{I}. \tag{2} \end{align} donde $\mathscr{I}$ es la clase de rectángulos acotados en $\mathbb{R}^2$ :
\begin{align} \mathscr{I} = \{(a_1, b_1] \times (a_2, b_2]: a_1 < b_1, a_2 < b_2\}. \end{align}

Nuestro objetivo es demostrar $f = 0$ a.e. en $\mathbb{R}^2$ bajo la condición $(2)$ (lo que obviamente implica $g = 0$ a.e. en $\mathbb{R}^2$ ). Esto está implícito $^\dagger$ par $f = 0$ a.e. en $I_M := (-M, M] \times (-M, M]$ para arbitraria $M > 0$ a lo que demostramos a continuación.

Es bien sabido que $\mathscr{I}$ genera el Borel $\sigma$ -campo $\mathscr{R}^2$ en $\mathbb{R}^2$ Por lo tanto $\mathscr{I} \cap I_M$ genera el $\sigma$ -campo $\mathscr{R}^2 \cap I_M := \{A \cap I_M: A \in \mathscr{R}^2\}$ en $I_M$ (véase el teorema 10.1 en Probabilidad y medida de Patrick Billingsley para la prueba). Por lo tanto, si podemos demostrar que la clase \begin{align} \mathscr{A} := \left\{A \in \mathscr{R}^2 \cap I_M: \int_A f(x, y)dxdy = 0\right\} \tag{3} \end{align} es un $\sigma$ -campo en $I_M$ entonces $\mathscr{I} \cap I_M \subset \mathscr{A}$ (que está implícito en $(2)$ ) y $\sigma(\mathscr{I} \cap I_M) = \mathscr{R}^2 \cap I_M$ implican que $\mathscr{R}^2 \cap I_M \subset \mathscr{A}$ . Desde $f$ es medible, $A_1 := \{(x, y): f(x, y) > 0\} \in \mathscr{R}^2$ y $A_2 := \{(x, y): f(x, y) < 0\} \in \mathscr{R}^2$ de donde $A_1 \cap I_M \in \mathscr{A}$ , $A_2 \cap I_M \in \mathscr{A}$ . Se deduce entonces por $\mathscr{I} \cap I_M \subset \mathscr{A}$ y $(3)$ que \begin{align} \int_{A_1 \cap I_M}f(x, y)dxdy = 0, \quad \int_{A_2 \cap I_M} -f(x, y)dxdy = 0. \tag{4} \end{align}

Tenga en cuenta que $fI_{A_1} = f^+ = \max(f, 0) \geq 0$ y $-fI_{A_2} = f^- = \max(-f, 0) \geq 0$ , $(4)$ puede reescribirse como \begin{align} \int_{I_M}f^+(x, y)dxdy = \int_{I_M}f^-(x, y)dxdy = 0, \end{align} lo que implica que $f^+ = f^- = 0$ a.e. en $I_M$ . Por lo tanto, $f = f^+ - f^- = 0$ a.e. en $I_M$ .

Por lo tanto, para completar la demostración, queda por demostrar que $\mathscr{A}$ es un $\sigma$ -campo. De hecho, porque $\mathscr{I} \cap I_M$ es un $\pi$ -basta con demostrar que $\mathscr{A}$ es un $\lambda$ -sistema en vista de Dynkin $\pi$ - $\lambda$ teorema . Para ello:

  1. $I_M \in \mathscr{A}$ . Esto se deduce de $(2)$ directamente.
  2. Si $A \in \mathscr{A}$ entonces \begin{align} \int_{I_M - A}f(x)dxdy = \int_{I_M}f(x)dxdy - \int_A f(x)dxdy = 0 - 0 = 0, \end{align} que muestra $I_M - A$ se encuentra en $\mathscr{A}$ . Por lo tanto $\mathscr{A}$ se cierra bajo la formación de complementación.
  3. Si $A_n$ se encuentra en $\mathscr{A}$ para todos $n$ y $A_1, A_2, \ldots$ son disjuntos, entonces $|fI_{\cup_n A_n}| \leq |f|$ (tenga en cuenta que $\int_{I_M}fd\lambda = 0$ implica que $f$ es integrable en $I_M$ ) y el teorema de convergencia dominada de Lebesgue implican que \begin{align} \int_{\cup_n A_n} fd\lambda = \sum_n \int_{A_n}fd\lambda = 0, \end{align} que muestra $\cup_n A_n$ se encuentra en $\mathscr{A}$ . Por lo tanto $\mathscr{A}$ es cerrado bajo la formación de uniones disjuntas contables.

Esto completa la prueba.


$^\dagger$ : Para cada $m \in \mathbb{N}$ definir $B_m = \{x \in I_m: f(x) \neq 0\}$ . Entonces la secuencia $\{B_m\}$ es creciente y converge al conjunto $\cup_{m = 1}^\infty B_m = \{x \in \mathbb{R}^2: f(x) \neq 0\}$ . De la continuidad desde abajo de $\lambda$ y $f = 0$ a.e. en cada $I_m$ que $\lambda(\cup_{m = 1}^\infty B_m) = \lim_{m \to \infty}\lambda(B_m) = 0$ es decir, $f = 0$ a.e. en $\mathbb{R}^2$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X