21 votos

El sentido del análisis de componentes independientes

He visto y disfrutado la pregunta Análisis de componentes principales y ahora tengo la misma pregunta para el análisis de componentes independientes. Quiero decir que quiero hacer una pregunta exhaustiva sobre las formas intuitivas de entender ICA?

Quiero comprender lo. Quiero entender su propósito. Quiero sentirlo. Lo creo firmemente:

No entiendes algo de verdad a menos que puedas explicárselo a tu abuela.
-- Albert Einstein

Bueno, no puedo explicar este concepto a un lego o abuela

  1. ¿Por qué la ACI? ¿Cuál era la necesidad de este concepto?
  2. ¿Cómo se lo explicaría a un profano?

18voto

David Puntos 1

Aquí está mi intento.

Fondo

Consideremos los dos casos siguientes.

  1. Eres un detective privado en una fiesta. De repente, ves a uno de tus antiguos clientes hablando con alguien, y puedes oír algunas de las palabras pero no del todo, porque también oyes a otra persona que está a su lado, participando en una discusión no relacionada sobre deportes. No quieres acercarte, te descubriría. Decides coger el teléfono de tu compañero (que está ocupado convenciendo al camarero de que la cerveza sin alcohol es estupenda) y plantarlo a unos 10 metros a tu lado. El teléfono está grabando, y el teléfono también graba la charla del antiguo cliente, así como al deportista entrometido. Coges tu propio teléfono y empiezas a grabar también, desde donde estás. Al cabo de unos 15 minutos te vas a casa con dos grabaciones: una desde tu posición y otra desde unos 10 metros de distancia. Ambas grabaciones contienen a tu antiguo cliente y al Sr. Deportista, pero en cada grabación, uno de los altavoces tiene un volumen ligeramente distinto en relación con el otro (y este volumen relativo se mantiene constante durante toda la charla para cada grabación, porque afortunadamente ninguno de los participantes se movió por la sala).
  2. Sacas una foto de un bonito perro Labrador Retriever que ves por la ventana. Compruebas la imagen y, por desgracia, ves un reflejo de la ventana que está entre el perro y tú. No puedes abrir la ventana (es de esas, sí) y no puedes salir porque tienes miedo de que se escape. Así que tomas (por alguna razón poco clara) otra imagen, desde una posición ligeramente diferente. Sigues viendo el reflejo y al perro, pero ahora están en posiciones diferentes, ya que tomas la foto desde un lugar distinto. Observa también que la posición ha cambiado uniformemente para cada píxel de la imagen, porque la ventana es plana y no cóncava/convexa.

La cuestión es, en ambos casos, cómo restaurar la conversación (en 1.) o la imagen del perro (en 2.), dadas las dos imágenes que contienen las mismas dos "fuentes" pero con contribuciones relativas ligeramente diferentes de cada una. Seguro que mi nieto culto puede entenderlo.

Solución intuitiva

¿Cómo podemos, al menos en principio, recuperar la imagen del perro a partir de una mezcla? Cada píxel contiene valores que son la suma de dos valores. Pues bien, si cada píxel se diera sin ningún otro píxel, nuestra intuición sería correcta: no habríamos podido adivinar las contribuciones relativas exactas de cada uno de los píxeles.

Sin embargo, se nos da un conjunto de píxeles (o puntos en el tiempo en el caso de la grabación), que sabemos que mantienen las mismas relaciones. Por ejemplo, si en la primera imagen, el perro es siempre dos veces más fuerte que el reflejo, y en la segunda es justo lo contrario, entonces podríamos obtener las contribuciones correctas después de todo. Y entonces podremos encontrar la forma correcta de restar las dos imágenes para que el reflejo se anule exactamente. [Matemáticamente, esto significa encontrar la matriz inversa de la mezcla].

Profundizar en los detalles

Digamos que tienes una mezcla de dos señales, $$Y_1=a_{11}S_1+a_{12}S_2 \\ Y_2 = a_{21}S_1 + a_{22} S_2 $$

y digamos que le gustaría obtener de nuevo $S_1$ en función de las dos mezclas, $Y_1,Y_2$ . Y supongamos también que quieres una combinación lineal: $S_1=b_{11} Y_1 + b_{12} Y_2$ . Por lo tanto, todo lo que tiene que hacer es encontrar el mejor vector $(b_{11},b_{12})$ y ahí lo tienes. Del mismo modo para $S_2$ y $(b_{21},b_{22})$ .

Pueden tener un aspecto similar, estadísticas parecidas, etc. Así que vamos a suponer que son independientes. Eso es razonable si tienes una señal que interfiere, como el ruido, o si las dos señales son imágenes, la señal que interfiere puede ser un reflejo de otra cosa (y tomaste dos imágenes desde ángulos diferentes).

Ahora, sabemos que $Y_1$ y $Y_2$ son dependientes. Dado que no podemos recuperar $S_1,S_2$ exactamente, denotamos nuestra estimación para estas señales como $X_1,X_2$ respectivamente.

¿Cómo podemos hacer $X_1,X_2$ estar lo más cerca posible de $S_1,S_2$ ? Como sabemos que estos últimos son independientes, podríamos hacer $X_1,X_2$ lo más independiente posible, jugando con los valores de $b_{ij}$ . Después de todo, si la matriz $\{a_{ij}\}$ es invertible, podemos encontrar alguna matriz $\{b_{ij}\}$ que invierte la operación de mezcla (y si no es invertible, podemos acercarnos), y si las hacemos independientes, buena posibilidad de que restauremos nuestra $S_i$ señales.

Si está convencido de que debemos encontrar $\{b_{ij}\}$ que hace $X_1,X_2$ independiente, ahora tenemos que preguntarnos cómo hacerlo.

Si sumamos varias señales independientes no gaussianas, la suma será "más gaussiana" que los componentes. ¿Por qué? debido al teorema del límite central, y también se puede pensar en la densidad de la suma de dos variables indep., que es la convolución de las densidades. Si sumamos varias variables indep. Bernoulli, la distribución empírica se parecerá cada vez más a una forma gaussiana. ¿Será una verdadera gaussiana? Probablemente no (no es un juego de palabras), pero podemos medir la gaussianidad de una señal por la medida en que se parece a una distribución gaussiana. Por ejemplo, podemos medir su exceso de curtosis. Si es muy alta, probablemente sea menos gaussiana que otra con la misma varianza pero con un exceso de curtosis cercano a cero.

Por lo tanto, si tuviéramos que encontrar los pesos de mezcla, podríamos tratar de encontrar $\{b_{ij}\}$ formulando un problema de optimización que, en cada iteración, haga que el vector de $X_1,X_2$ ligeramente menos gaussiano. Tenga en cuenta que puede que no sea verdaderamente gaussiano en ningún momento, pero sólo queremos reducir la gaussianidad. Con suerte, finalmente, y si no nos atascamos en mínimos locales, obtendríamos la matriz de mezcla hacia atrás $\{b_{ij}\}$ y recuperar nuestras señales indep.

Por supuesto, esto añade otro supuesto: para empezar, las dos señales tienen que ser no gaussianas.

3voto

Valentin Kantor Puntos 176

Muy sencillo. Imagina que tú, tu abuela y los miembros de la familia estáis reunidos alrededor de la mesa. Los grupos más grandes de personas tienden a dividirse cuando el tema del chat es específico de ese subgrupo. Tu abuela está sentada y oye el ruido de toda la gente hablando, lo que parece ser una cacofonía. Si se vuelve hacia un grupo, puede aislar claramente las discusiones en el grupo de adolescentes/jóvenes, si se vuelve hacia el otro grupo, puede aislar la charla de la gente adulta.

En resumen, ICA consiste en aislar o extraer una señal específica (una persona o un grupo de personas hablando) de una mezcla de señales (una multitud hablando).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X