6 votos

¿Cómo puedo recuperar una secuencia de números dada una versión corrupta de la misma?

Tengo una secuencia desconocida de números reales $x_i$ y una secuencia conocida de números reales $y_i$ ; $y_i$ es una versión corrupta de $x_i$ es decir,

$$y_i=x_i+n_i$$

donde $n_i$ es un número aleatorio distribuido según una función de distribución de probabilidad conocida $f(x,\boldsymbol{\theta})$ , $\boldsymbol{\theta}$ es conocido y es el conjunto de los parámetros de la distribución; por ejemplo cuando $f$ es una distribución normal $\boldsymbol{\theta}=(\mu,\sigma)$ , $\mu$ es la media y $\sigma$ es la desviación típica.

Dado $y_i$ , $f$ , $\boldsymbol{\theta}$ ¿es posible recuperar $x_i$ ?

Actualización:

Dado que el problema parece demasiado amplio (véanse los comentarios 1 y 2 ) Me gustaría añadir la restricción de que $x_i>x_{i+1},\forall{i}$ .

0 votos

¿Sabes algo de la secuencia $x_i$ ? Si sabemos, por ejemplo, que en general permanece estática o es monótona o algo parecido, entonces podemos hacer nuevas estimaciones. Si sólo sabemos que es un montón de números, entonces $y_i$ es la mejor suposición que vamos a conseguir para $x_i$ .

0 votos

@MiloBrandt Me interesa el problema general descrito más arriba, pero también algunas simplificaciones del mismo, como, por ejemplo, el caso de una sucesión monótona. ¿Crees que tengo que hacer una pregunta diferente para ello o editar mi pregunta original?

0 votos

@AlessandroJacopson Creo que la pregunta es demasiado general. Limitarlo a una distribución específica y / o un tipo más específico de secuencia podría hacer esto un poco más accesible.

6voto

Yves Daoust Puntos 30126

¿Cómo puede ser?

Si no hay restricciones en el $x_i$ todo lo que sabes son intervalos de confianza del $x_i$ alrededor de sus respectivos $y_i$ . Pero los valores exactos de los $x_i$ siguen siendo esencialmente desconocidos.

Por ejemplo, con $n$ distribuidos uniformemente en $[-1,1]$ y $Y=\{0.5,3\}$ se puede decir que

  • $x_0\in[-0.5,1.5]$ y $x_1\in[2,4]$ con probabilidad $1$ .

  • $x_0\in[0.4,0.6]$ y $x_1\in[2.9,3.1]$ con probabilidad $\frac1{100}$ .

  • ...

La adición de la restricción de monotonicidad modificará algo la amplitud de los intervalos de confianza, pero la $x_i$ siguen siendo igual de escurridizos.

0 votos

No creo que el PO esté formulando el problema de la manera correcta.

2voto

Debra Puntos 2729

Supongamos que $x = n$ ( $n$ siendo desconocido). Sin más suposiciones, no hay forma de saber si $y$ es $0.5n+0.5n$ o $0.7n+0.3n$ . Sin embargo, todo un campo se ocupa de producir estimaciones aceptables de $y$ dado un conocimiento parcial de las propiedades de $x$ o $n$ .

Se denomina tratamiento de señales (o imágenes) (subcampos: filtrado, suavizado, separación de fuentes). Como el tema es demasiado amplio para responder aquí, dejo caer algunas tendencias actuales: Modelización bayesiana , estimación no lineal del riesgo , aproximaciones dispersas .

Para más información, consulte StackExchange Procesamiento de señales: SE.DSP . Una pregunta relacionada se plantea y se responde en ¿Los datos de las series temporales siempre contienen ruido?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X