8 votos

Procesos gaussianos con área de muestreo finita

Me disculpo de antemano si esta pregunta está mal planteada: Soy astrónomo, no estadístico. Mi pregunta está dirigida específicamente a ayudarme a averiguar si los procesos gaussianos son una técnica apropiada para mi problema.

Utilizando un telescopio y un espectrógrafo alimentado por fibra, mi proyecto ha tomado el espectro óptico de una galaxia en muchos puntos. El patrón de muestreo para un solo apunte está en la primera imagen, y se repite tres veces en total, con diferentes desplazamientos espaciales, para rellenar los huecos (segunda imagen). Lo ideal sería construir estimaciones de ciertas cantidades en una cuadrícula que cubra la galaxia.

Sampling pattern for a single telescope pointing Multi-pointing offset pattern

Mi método ingenuo sería analizar el espectro de cada fibra por separado, de modo que tuviera $3 N_{fibers}$ estimaciones puntuales de las cantidades de interés, y luego construir un proceso gaussiano para estimar esas cantidades en todas partes. Del mismo modo, podría construir un proceso gaussiano para los propios espectros, y luego analizar la GP en mi cuadrícula de elección para encontrar las cantidades que me interesan. Sin embargo, no estoy seguro de que esto sea un enfoque válido, ya que mis observaciones no son discretas, sino que son coincidentes.

A diferencia, por ejemplo, de los científicos del suelo, que podrían tomar muestras de tierra de un lugar muy discreto, y luego alejarse 50 metros y repetir, mis observaciones se superponen espacialmente, por lo que estoy integrando toda la luz que emite una galaxia. No me parece obvio que se me permita despreciar cualquier variación espacial que pueda existir dentro de una determinada medición. En otras palabras, ¿es válido un proceso gaussiano incluso cuando los lugares de muestreo individuales no son pequeños? ¿Puedo incorporar un término espacial adicional para tener en cuenta la "mezcla" de luz dentro de una sola fibra?


Apéndice: Tradicionalmente, los espectros se interpolan, se vuelven a muestrear en una cuadrícula y luego se analizan, lo que también me parece extremadamente erróneo, pero si voy a aguarles la fiesta a mis colegas, quiero al menos presentar un método alternativo.

6voto

Jamiro14 Puntos 396

Creo que tus dos preguntas dan en el clavo. Parece que puedes utilizar las GP para una parte del problema, pero puede que necesites hacer algo más. Para explicar los problemas que veo, primero traduciré mi comprensión de tu problema a un lenguaje más matemático:

  1. El problema

Usted está interesado en alguna cantidad física $f(x)$ (¿"espectro"?) donde $x$ es un punto en algún dominio del plano (su foto). $f$ es escalar, es decir, un único número para cada punto del plano. No se puede observar $f$ directamente, sólo se puede observar una media espacial de la misma $F$ en algunos puntos $s_k$ de una cuadrícula. Es decir, se observa $$ F(s_k) = \int_{D_k} f(x)dx.$$ El $D_k$ son los distintos discos superpuestos en tu foto. No lo has mencionado, pero puede que también haya algún ruido de medición en tus observaciones, entonces tendrías que añadir un término de ruido $\epsilon$ en el lado derecho.

  1. ¿Y los médicos de cabecera?

Es absolutamente correcto ajustar una GP a sus observaciones y obtendrá una aproximación o interpolación GP válida de $F$ . Al médico de cabecera realmente no le importa que su $F$ se hace a partir de discos superpuestos, notará y reflejará la cantidad justa de correlación para los valores suficientemente cercanos entre sí. El problema es, por supuesto, que esto producirá una GP para $F$ no uno para $f$ . Y $F$ no será una (buena/razonable) aproximación de $f$ a menos que $f$ es más o menos constante en el $D_k$ .

  1. Cómo recuperarse $f$ ?

Hay diferentes formas de recuperar $f$ de $F$ . Lo que es factible o incluso "mejor" depende de sus requisitos específicos y de los detalles del problema. Dado que conoce la función media $m_F$ de $F$ explícitamente podría intentar alguna forma de deconvolución numérica.

Una forma más animada de GP es hacer la suposición de que $f$ es una GP con función media $m$ y la función de covarianza $K$ . La teoría matemática te dice entonces que $F$ es una GP también con función media $$m_F(s) = \int_{D_s}m(x)dx$$ y la covarianza $$ K_F(s_1,s_2) = \int_{D_{s_1}}\int_{D_{s_2}} K(x_1,x_2)dx_1dx_2$$ .

El teorema del representador para la media de un GP dice entonces que $m_F(s) = \sum_k \alpha_k K_F(s_k,s)$ y se puede concluir comparando los coeficientes que $$ m(s) = \sum_k \alpha_k \int_{D_k} K(x,s) dx. $$

También se puede derivar la distribución predictiva en un punto $s^*$ al señalar que $f(s^*)$ y las observaciones de $F$ tienen una distribución normal conjunta y se puede condicionar a las observaciones de $F$ . Sin embargo, las fórmulas se complican, pero son sencillas (véase esto papel Ecuaciones (8) y (9) )

El problema de esto está en la parte práctica: O bien hay que encontrar el núcleo $K$ de su elección de $K_F$ lo cual es probablemente difícil o se empieza con un $K$ tal que (i) se puede calcular $K_F$ Y (ii) $K_F$ funciona razonablemente bien para sus observaciones Y (iii) $K$ tiene sentido como modelo para sus datos astronómicos.

0 votos

Gran debate. ¿Podríamos imaginar en su lugar un procedimiento como 1) Expandir F en las funciones base elegidas, 2) Estimar el vector de parámetros y construir $\hat{F}$ 3) Tomar la derivada de $\hat{F}$ para recuperar $\hat{f}$ ?

0 votos

Sí, pero el paso 3 sólo funciona en una dimensión, no en dos, como en este caso.

0 votos

¿Incluso si tomas una derivada direccional?

1voto

Hay un tema en geoestadística llamado Exact Downscaling. El objetivo principal aquí es estimar una propiedad a una escala más pequeña que las observaciones. Además, estas observaciones pueden estar superpuestas o no (no importa realmente). Por favor, eche un vistazo a este documento: http://www.ccgalberta.com/ccgresources/report07/2005-101-exact_reproduction.pdf

En este trabajo, muestran un método para reducir la escala de las observaciones utilizando técnicas geoestadísticas. Demuestran que calculando correctamente las covarianzas cruzadas entre las diferentes escalas de datos (punto frente a bloque) la estimación de kriging sigue siendo válida; de forma que la media de los valores estimados a menor escala es igual a los datos de entrada más grandes. Básicamente, para calcular los valores estimados en cualquier escala, sólo hay que calcular correctamente la función de covarianza entre los datos de entrada, las escalas objetivo y las correlaciones cruzadas. En el proceso gaussiano, se supone que la estimación se realiza a la misma escala que las observaciones de entrada.

Así que estos son los pasos: 1- Calcular el variograma experimental a partir de sus datos.

2- Ajuste el modelo de variograma a su variograma experiencial. Es posible que tenga que tener en cuenta la anisotropía direccional aquí. Esta es la función de covarianza que en GP se calcula por el método de máxima verosimilitud.

3- Calcular todas las covarianzas y covarianzas cruzadas entre los datos de entrada y la escala objetivo. Existen recetas numéricas para este paso. La idea es que al discretizar los bloques en puntos finitos, se puede calcular la covarianza media. Aquí hay que tener en cuenta los datos superpuestos.

4- realizar Kriging y calcular los valores estimados.

La GP es un tema muy relacionado con la geoestadística. Sin embargo, la geoestadística no se limita a los procesos gaussianos. Hay muchos otros métodos para estimar o simular un proceso aleatorio.

1 votos

Bienvenido al sitio. Estamos intentando construir un repositorio permanente de información estadística de alta calidad en forma de preguntas y respuestas. Por lo tanto, desconfiamos de las respuestas con enlaces, debido al linkrot. ¿Puede publicar una cita completa y un resumen de la información en el enlace, en caso de que se pierda?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X