7 votos

Teoría para comprobar si $\mu \in \mathbb{Q}$ para $X \sim \mathcal{N}(\mu, \sigma^2)$

Supongamos que $X_i \stackrel{\mbox{i.i.d.}}{\sim} \mathcal{N} (\mu, \sigma^2)$ , donde $\sigma^2$ es conocido. Con estos datos, queremos comprobar si $\mu \in \mathbb{Q}$ es decir, si la media $\mu$ es un número racional.

Parece intuitivamente claro que no podemos hacerlo, ya que cualquier ruido será demasiado ruido. Me imagino que cualquier prueba tendrá una tasa de error de tipo II $\beta = 0$ y la tasa de error tipo I $\alpha = 1$ o viceversa. Pero, no entiendo cómo hacer afirmaciones teóricas sobre este problema de comprobación de hipótesis. ¿Cómo encaja este problema en un marco más general que ilustre cuándo las pruebas son "difíciles"?

7voto

Aaron Puntos 36

Su intuición es correcta: Cuando se tiene un conjunto nulo para la media que es denso con respecto al espacio total, no se podrán diferenciar los conjuntos nulos y alternativos con datos continuos. Esto se debe a que, para cualquier valor de la media en la hipótesis alternativa, siempre podemos obtener uno que esté "arbitrariamente cerca" en el conjunto nulo. Por lo tanto, nunca debería haber ninguna prueba para la hipótesis alternativa.

Para obtener una demostración formal de este resultado, hay que construirlo como una prueba de hipótesis compuesta. Esto es un poco complicado, ya que hay que argumentar a favor de algún estadístico de prueba, y aquí hay algunas objeciones plausibles.


Construcción formal de la prueba de hipótesis clásica: Para esta prueba las hipótesis son:

$$\begin{equation} \begin{aligned} H_0 &: \mu \in \mathbb{Q}, \\[4pt] H_A &: \mu \notin \mathbb{Q}. \end{aligned} \end{equation}$$

El primer problema que se plantea es la construcción de una estadística de prueba. El estadística de ratio de probabilidad (LR) para este problema es siempre igual a uno, ya que los racionales son densos en los reales. Tenemos:

$$\sup_{\mu \in \mathbb{Q}} \sup_{\sigma >0} \prod_{i=1}^n \text{N}(x_i | \mu, \sigma^2) = \Big( \frac{n}{2 \pi \sum x_i^2} \Big)^{n/2} \exp \Big( - \frac{n}{2} \Big) = \sup_{\mu \notin \mathbb{Q}} \sup_{\sigma >0} \prod_{i=1}^n \text{N}(x_i | \mu, \sigma^2),$$

para que el cociente de estos supremos sea la unidad. Esto significa que el estadístico LR estándar no sirve como medida de la evidencia de las hipótesis, por lo que necesitamos un estadístico de prueba personalizado.

Ahora bien, para estas hipótesis, la clasificación ordinal de las pruebas se divide en sólo dos categorías: si la media de la muestra es racional (lo que ocurre con probabilidad cero), es una prueba mayor para la hipótesis nula; si la media de la muestra es irracional (lo que ocurre con probabilidad uno), es una prueba mayor para la hipótesis alternativa. Por lo tanto, el estadístico de prueba apropiado para la prueba es $T \equiv T(X_1, ..., X_n) \equiv \mathbb{I}(\bar{X} \notin \mathbb{Q})$ Los valores más altos de este estadístico de prueba (indicador) constituyen una mayor evidencia para la alternativa.

Desde $\bar{X} \sim \text{N}(\mu, \sigma^2 /n)$ es continua, tenemos $\mathbb{P}(T = 0 | \mu, \sigma) = \mathbb{P}(\bar{X} \in \mathbb{Q} | \mu, \sigma) = 0$ sobre todos los valores de los parámetros (esto se deduce del hecho de que los racionales tienen medida de Lebesgue cero ). Esto significa que la estadística de la prueba tiene la misma distribución independientemente de los valores de los parámetros.

Si observamos $\bar{x} \notin \mathbb{Q}$ (es decir, la media de la muestra es irracional) entonces el valor p de la prueba es:

$$p \equiv \mathbb{P}(T(\bar{X}) \geqslant t(\bar{x}) | H_0) = \mathbb{P}(T \geqslant 1 | \mu \in \mathbb{Q}) = 1.$$

Si observamos $\bar{x} \in \mathbb{Q}$ (es decir, la media de la muestra es racional) entonces el valor p para la prueba es:

$$\begin{equation} \begin{aligned} p \equiv \mathbb{P}(T(\bar{X}) \geqslant t(\bar{x}) | H_0) &= \mathbb{P}(T \geqslant 0 | \mu \in \mathbb{Q}) = 1. \end{aligned} \end{equation}$$

Así, vemos que incluso con un estadístico de prueba personalizado que intenta diferenciar las hipótesis, nunca obtenemos ninguna prueba contra la nula. Esto es intuitivamente razonable, ya que para cualquier valor medio en la hipótesis alternativa, siempre podemos obtener uno que esté "arbitrariamente cerca" en el conjunto nulo.

2 votos

Por supuesto, todo esto es correcto (+1), pero me gustaría sugerir que el enfoque en la topología de los racionales y los reales, y su medida de Lebesgue, pasa por alto un punto más fundamental (que usted hace, pero tal vez no enfatiza tanto como podría). Si, Por ejemplo el modelo era el conjunto de distribuciones normales con parámetros $(\mu, \sigma^2(\mu))$ donde $\sigma(\mu)=1$ para $\mu\in\mathbb{Q}$ y $\sigma(\mu)=2$ De lo contrario, usted podría prueba $H_0:\mu\in\mathbb{Q}.$ El significado más fundamental de "denso" está en la topología en el modelo determinado por los coeficientes de probabilidad logarítmica.

2 votos

Buen punto - mi propia discusión se limitó al caso particular en cuestión, pero ciertamente sería interesante extender esto a una discusión más amplia a esos casos más amplios.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X