4 votos

La estimación de la "tamaño de paso" de una cuadrícula

Supongamos que uno es, dado un conjunto de $M$ puntos distribuidos en un "grid", me.e: $$x_i = x_0 + \alpha n_i + \epsilon_i, \quad n_i\in\mathbb{Z}$$ Esto podría gustar algo como esto:

$\quad\ \quad\quad\quad\quad\quad\quad$enter image description here

Es decir, cada uno de los puntos se encuentra en una posición de la rejilla con el tamaño de la cuadrícula $\alpha$, hasta cierta cantidad de ruido Gaussiano $\epsilon_i \sim N(0,\sigma)$.

He tratado de escribir el estimador de máxima verosimilitud, pero desde la $n_i$ no son conocidos a priori, uno obtiene una ecuación irresoluble para $\alpha$: $$\alpha = \frac{\sum (x_i - x_0)n_i}{\sum n_i^2}\ =\ ?$$

¿Cómo se podía estimar el tamaño de la cuadrícula $\alpha$?

Intuitivamente, uno puede "ver" la solución, pero no está claro cómo se puede conseguir el MLE. En mi opinión, el problema deriva del hecho de que $n_i$ son enteros no está siendo utilizado, aunque no está claro cómo se hace cumplir esta restricción.

2voto

tedbundyjr Puntos 101

Probablemente voy a utilizar los siguientes numéricos de aproximación. Supongamos por el momento que los parámetros $x_0$ $\alpha$ son conocidos. Entonces podemos calcular para cada punto de datos $i$ el valor más probable para $n_i$ como sigue: $n_i = (x_i - x_0) / \alpha$. El resultado es un número real, así que redondear al entero más cercano. A continuación podemos calcular la diferencia de $\Delta x_i$ entre los datos reales de punto y el valor obtenido de la red modelo. Ahora evaluar $S$, la suma de los cuadrados de $\Delta x_i$. Esperamos que $S$ tener una estrategia bien definida, nítida como mínimo, como una función de $x_0$$\alpha$. Estos son los estimadores de máxima verosimilitud.

EDIT: pensé acerca de este interesante problema por un par de días. También hice algunos tests numéricos. Podemos organizar los valores de $x_i$, en orden ascendente, y luego calcular el vecino más cercano diferencias $y_i = x_{i+1} - x_i$. Ahora idealmente, el original conjunto de valores es grande y compacto, y el ruido muy pequeño en comparación con el tamaño de paso. A continuación, el conjunto ordenado de $y_i$ valores podría parecerse a: $1, 1, 1, 2, 5, 6, 6, 6, 7, 10, 12...$ Ahora es un asunto trivial para reconocer que el tamaño de paso es igual a $1$. [Este valor puede ajustarse más al minimizar $S$.] Por otro lado, el peor escenario es que los puntos que están separados por grandes múltiplos del tamaño de paso, y que el ruido es del orden del tamaño del paso. A continuación, la función de error $S$ vuelve muy desordenado. Oscila violentamente, y no hay ninguna correlación aparente entre las posiciones de todos los mínimos en $S$ reales y el tamaño del paso. En ese terreno, yo creo que es raro que no existe una solución analítica para el caso general.

EDIT 2: La OP del problema se expresa de una forma tan amplia, que por un lado es aplicable a la fácil casos en los que encontrar la solución es casi trivial, mientras que en la otra mano, permitiendo así que por muy difícil casos (muy pequeño $\alpha$ muy grande e $n_i$; o el ruido de la orden de $\alpha$) que bien podría ser insolvable. Por eso yo sugiero el siguiente enfoque [basado en el análisis de Fourier], ya que también proporciona una prueba para distinguir la "solución" de los casos de la "insolvable" de los casos.

Primer lugar, calcular las siguientes cuatro funciones de suma:

$$f_1(\alpha) = (1/N)* \Sigma _{j=1} ^N \, cos(2 \pi x_j / \alpha)$$

$$f_2(\alpha) = (1/N)* \Sigma _{j=1} ^N \, sin(2 \pi x_j / \alpha)$$

$$g_1(\alpha) = (1/N)* \Sigma _{j=1} ^N \, x_j cos(2 \pi x_j / \alpha)$$

$$g_2(\alpha) = (1/N)* \Sigma _{j=1} ^N \, x_j sin(2 \pi x_j / \alpha)$$

Ahora vamos a definir la función de error $S(\alpha)$ del ajuste de la siguiente manera:

$$S(\alpha) = 1 - f_1^2(\alpha) - f_2^2(\alpha)$$

Tenga en cuenta que $0 \le S \lt 1$. El caso de $S = 0$ corresponde a un ajuste perfecto del tamaño de la cuadrícula $\alpha$ a los datos de $x_j$. En general, para valores arbitrarios de $\alpha$, $S$ normalmente es $0.9$. La tarea es buscar el mínimo global de $S$. Denota la derivada de $S(\alpha)$ con respecto al $\alpha$$T(\alpha)$, obtenemos:

$$T(\alpha) = f_1(\alpha) g_2(\alpha) - f_2(\alpha) g_1(\alpha)$$

Debemos resolver: $T(\alpha) = 0$. Ahora, en la práctica, vamos a encontrar muchos ceros para $T$. Eso es porque la función de $S$ tiene muchos extremos locales. Para distinguir una buena (candidato) solución para el tamaño de la cuadrícula $\alpha$ a partir de un pobre, simplemente tomamos el acompañamiento valor de $S$ en cuenta y compararlo con un valor máximo permitido, decir $M = 0.5$. Por lo tanto el método se reduce a:

Encontrar los valores de $\alpha$ que $T(\alpha) = 0$$S(\alpha) < M$.

Para una fácil casos este método funciona bien en la obtención de la correcta tamaño de la cuadrícula (como candidato a una solución que puede ser probado y/o afinado). Sin embargo, para los casos difíciles, por ejemplo cuando el nivel de ruido es considerable, es muy probable que ninguno de los candidatos se encuentran las soluciones ! En mi opinión esto es aceptable. No se puede esperar más de un método general para este problema.

1voto

Bey Puntos 1928

No hay solución analítica, porque su problema no es lo suficientemente limitados:

Permite expresar su entramado de la ecuación de una forma un poco diferente:

$$x_i=x_0+k_i+e_i$$, where $k=\alpha n_i$.

En otras palabras $x_i\sim \mathcal{N}(x_0+k_i,\sigma)$

Ahora, usted está permitiendo que el $n_i$ en su formulación original a ser libre, por lo que ni siquiera sabemos que $E[x_{i+1}]\geq E[x_i]$.

Esta formulación alternativa es, básicamente, una de efectos fijos modelo de estimación. El MLE para $k_i$ es sólo de los valores observados menos $x_0$.

Ahora, ¿por qué no es posible estimar el $\alpha$. Bueno, en realidad, la respuesta es que usted puede conseguir un flojo límite superior, sino que está sobre él:

Si asumimos que el $\alpha > \mathrm{Range(\{x_i\})}$ entonces se convierte en exceedigly raro como $\alpha\to \infty$ Esto es debido a la integralidad de la $n$.

Sin embargo, la inversa no es verdadera. Como $\alpha \to 0$ la integralidad de la $n$ se vuelve menos relevante. Desde los racionales son densos en los reales, hay un número infinito de combinaciones de $\alpha$ e las $n_i$ que conducirá a los valores observados. Ya que no has puesto un previo de la probabilidad o probabilidad de cualquier valor particular de $n_i$, su modelo es indiferente a cualquier elección de $\alpha$$n_i$, mientras $\alpha \ll \min\{|x_i-x_j|\} i\neq j$.

Como un ejemplo, si $x_3=3+e_3$$\alpha=1\times 10^{-5}$$n_3=3\times 10^5$? O es $\alpha$ y un orden de magnitud más pequeñas y $n_3$ valor de un orden de magnitud más grande? No podemos decidir desde $n_3$ no tiene antes de la distribución o la probabilidad.

Así, su intento de estimación de $\alpha$ es anulada por una falta de restricciones. Te sugiero:

  1. Coloque una antes de la probabilidad o probabilidad en $n_i$. Estoy seguro de que hay algunos plausible límite. O
  2. Asumir de partida $\alpha \ll \min\{|x_i-x_j|\} i\neq j$, para resolver el $n_i$, a continuación, la celebración de los fijos, resolver por $\alpha$, a continuación, la celebración de $\alpha$ fijo, resolver por $n_i$ etc hasta llegar a la convergencia. De esta manera se consigue que un alfa que maximiza la probabilidad (no será infinitamente muchos).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X