7 votos

¿Prueba de ubicación bajo una no estacionariedad limitada?

Supongamos que yo dibuje $n$ observaciones $X_1,X_2,\ldots,X_n$ independientemente de la distribución donde se $X_i \sim \mathcal{N}(\mu_i,\sigma^2)$, donde la media es que se supone Lipschitz: $\left| \mu_i - \mu_{i+1}\right| \le \gamma,$ $\gamma$ conocido. Quiero poner a prueba la hipótesis nula: $$H_0: \mu_n = 0$$ en contra de la alternativa de $H_1: \mu_n > 0$.

Un par de preguntas:

  1. Es este un problema conocido? Si es así, por qué términos debería de búsqueda de google?
  2. Lo razonable es una forma de realizar esta prueba? Puedo imaginar que podría haber alguna manera de hacerlo por downweighting menos recientes observaciones, tal vez de tirar las innovaciones en el ruido plazo, entonces el uso de un promedio ponderado de t-test? El problema con este enfoque es que el cambio en el medio puede ser determinista, por lo que debe plantear el problema como un problema minimax tal vez. Tal vez otro enfoque sería ignorar la no-estacionariedad y el uso regular de la prueba t en algún subconjunto de observaciones $X_j,X_{j+1},\ldots,X_n$, $n-j$ elegido por algunos de la función de $\gamma, \sigma$ (probablemente su relación?), y aceptar que la prueba no va a mantener el Tipo nominal de la tasa. ¿Cuáles son algunas de las mejores ideas?

Edit: por los excelentes comentarios hasta ahora, creo que esta pregunta puede reformularse de la siguiente manera: Vamos a $V$ ser el conjunto convexo en $\mathbb{R}^n$ definido por: $$ V = \left\{\mathbf{x} | x_n = 0, x_{i-1} \le x_i + \gamma, x_{i-1} \ge x_i - \gamma, i = 2,\ldots,n \right\} $$ La observación de vectores $X = f + \sigma\epsilon$, donde los elementos de $\epsilon$ son dibujados de forma independiente a partir de un estándar de Gauss, la prueba de la hipótesis nula: $$H_0: f \in V$$ En este sentido, es similar a la del papel de Baraud et. al. mencionado por @Robin Girard, excepto el Baraud documento proporciona un método para el caso de que $V$ es un subespacio lineal de $\mathbb{R}^n$, no convexos polytope.

Bajo esta formulación, parece que, en virtud de la nulos, el cuadrado de la distancia de $X$ $f$se distribuye como una Chi-cuadrado, hasta el factor de escala de la $\sigma^2$. Entonces la distancia de $X$ $V$debe ser no mayor que. La prueba propuesta sería entonces para encontrar la proyección de $X$ a $V$, y la prueba de la distancia de $X$ a que la proyección basada en el test de la Chi-cuadrado obligado. Me imagino que esta prueba tendrá bastante baja potencia. Tal vez de truncar la observación de la final del subconjunto de la $X_i$ tendría más poder...

1voto

patfla Puntos 1

Ok, he pensado de dos maneras posibles para responder a este problema mediante el análisis Bayesiano. Voy a suponer $\sigma$ a ser conocido a través de esta respuesta. En primer lugar empezar con un "bebé", donde $n=2$ (o, alternativamente, usando solo las dos últimas observaciones como una primera aproximación). Se suele iniciar esta asumiendo un "plano" antes de $\mu$, justa proporción a 1. Pero usted tiene información adicional, así que sólo restringir la previa conforme a la presente. Así que la previa es: $$f(\mu_1,\mu_2|\gamma) \propto I_{|\mu_1-\mu_2|\leq\gamma}$$ (la inadecuada antes debe estar bien, porque estás tratando con la normal de la RVs, y que no se dividen) La combinación de esta previa con la probabilidad, y la integración de salida $\mu_1$ da (Escrito $\phi(x)$ como normal estándar pdf y $\Phi(x)$ como normal estándar cdf):

$$f(\mu_2 | X_1,X_2,\sigma,\gamma) \propto \phi\big(\frac{\mu_2-X_2}{\sigma}\big) \Bigg[\Phi\Big(\frac{\mu_2-X_1+\gamma}{\sigma}\Big)-\Phi\Big(\frac{\mu_2-X_1-\gamma}{\sigma}\Big)\Bigg]$$ Así que para calcular el "p-value" de la hipótesis, tenemos que tomar $Pr(\mu_2 > 0 |X_1,X_2,\sigma,\gamma)=P$. Esta está dada por la relación de las dos integrales de la parte posterior: $$P=\frac{\int_{-\frac{X_2}{\sigma}}^{\infty}\phi\big(y\big) \Bigg[\Phi\Big(y+\frac{X_2-X_1+\gamma}{\sigma}\Big)-\Phi\Big(y+\frac{X_2-X_1-\gamma}{\sigma}\Big)\Bigg]dy}{\int_{-\infty}^{\infty}\phi\big(z\big) \Bigg[\Phi\Big(z+\frac{X_2-X_1+\gamma}{\sigma}\Big)-\Phi\Big(z+\frac{X_2-X_1-\gamma}{\sigma}\Big)\Bigg]dz}$$

Es más allá de mis capacidades para hacer cualquiera de estas integrales exactamente, e incluso, si era posible, que probablemente iba a aprender nada intuitivo sobre el problema (excepto que la integral se friggin duro! usted pensaría que podría ser creadas usando algo que ver con circunvoluciones, pero no pude). Así que sólo evaluar numéricamente estas dos integrales.

Para todo el conjunto de datos, es casi seguro que se necesita algún tipo de técnica numérica o analítica aproximación. Este es un lugar rápido de la técnica numérica. Bueno, por lo que básicamente va de esta manera: si usted supiera $\mu_1$, entonces se podría generar una muestra de los restantes $\mu_i$ valores de forma secuencial, mediante la distribución uniforme $(\mu_{i}|\mu_{i-1}) \sim U(\mu_{i-1}-\gamma,\mu_{i-1}+\gamma)$. Una manera obvia de la muestra $\mu_1$ es de una gaussiana con gran variación $\mu_1 \sim N(0,\delta^2)$ ("grande", que significa en relación a sus datos, decir $\delta\approx 10\sigma$). El uso de la notación $\mu_{i}^{(b)}$ $b$th muestra de medios de $b=1,\dots,B$. Ahora se calcula el total de probabilidad para cada iteración. Esto será utilizado como un peso:

$$w^{(b)}=\prod_{i=1}^{n} \phi \Big(\frac{\mu_{i}^{(b)}-X_i}{\sigma}\Big)$$

Luego de tomar un "ponderado de la probabilidad" de la hipótesis alternativa:

$$\hat{P}=\frac{\sum_{b=1}^{B}w^{(b)} I(\mu_{n}^{(b)}>0)}{\sum_{b=1}^{B}w^{(b)}}$$

Si $P$ es demasiado grande (en cualquier caso), entonces se rechaza la hipótesis nula. Un valor estándar sería $P>0.95$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X