3 votos

¿Qué significa caracterizar un modelo como "media condicional"?

Últimamente he estado revisando material sobre series temporales, tratando de reinventarme como profesional en este campo. Hasta que llegué al punto de intentar utilizar algunos modelos en Matlab, nunca me había topado con la caracterización de los modelos como "media condicional". Este término está omnipresente en toda la documentación; por lo que sé, tiene un significado especial en términos de modelización.

No he sido capaz de entender qué significa esto. Se explica como la expresión de la expectativa de una variable de interés, condicionada a los valores de otras variables. Todos los modelos de series temporales que he visto (de hecho, todos los modelos de regresión) entran dentro de esta definición. Así que no estoy seguro de cómo el término clasifica los modelos de interés, o identifica un subconjunto, o identifica las características que tienen implicaciones de modelado. Nada de lo que he encontrado en Internet lo aclara.

Gracias si alguien puede aclarar, elaborar o explicar esto. Mi pregunta surgió en el contexto de Matlab (casualmente es lo que estoy usando), pero es una pregunta conceptual que no está necesariamente ligada a Matlab. Se ha publicado en: ¿Qué significa caracterizar un modelo como "media condicional"? , https://stackoverflow.com/questions/30406645/what-is-the-meaning-characterizing-a-model-as-conditional-mean y http://groups.google.com/forum/#!topic/comp.soft-sys.matlab/zQK8yScPFkk

4voto

eldering Puntos 3814

La primera vez que se suele ver este concepto es en la regresión lineal.

Supongamos que tenemos una relación hipotética entre dos variables aleatorias del tipo

Y=aX+b+ϵY=aX+b+ϵ

donde ϵϵ es alguna variable no observada que es simétrica respecto a su media de cero. Ahora supongamos que tomamos algunas observaciones de XX y YY y quiero usarlos para averiguar una buena estimación de los parámetros aa y bb en la relación. Pues bien, el valor de XX influye claramente en el valor de YY por lo que es posible que queramos proceder en dos etapas:

  • Dado que conozco un valor de XX ya, ¿qué puedo deducir sobre la distribución de YY ?
  • ¿Cuál es la distribución de XX ?

Un primer corte a la primera pregunta es preguntar:

Si conozco un valor de XX ya, ¿cuál es la media de YY ?

Y esta es la expectativa condicional de YY dado XX normalmente anotado E(YX)E(YX) (y que algunos denominan media condicional). Esta es la cantidad que la regresión lineal pretende estimar, porque:

E(YX)=aE(XX)+bE(1X)+E(ϵX)=aX+b+0=aX+b

Averiguar qué ocurre en cada uno de estos pasos y, posiblemente, qué me he dejado sin decir que es necesario para realizar el cálculo, es una buena forma de poner a prueba tu comprensión del concepto.

En series temporales, a menudo se construyen modelos autorregresivos, que asumen una relación como:

Yk=a0+a1Yk1+a2Yk2+ϵk

por ejemplo. En este caso, el mismo tipo de razonamiento nos dice que realmente nos gustaría conocer la media de Yk dado que ya conoce los valores de Yk1 y Yk2 . Esto se llama E(YkYk1,Yk2) . La coma a la derecha del símbolo de condición significa y en este contexto.

Entiendo lo que has explicado, y supongo que mi confusión es... ¿qué modelo de regresión o proyección de interés no es la media condicional? Es decir, ¿cómo es que esa caracterización añade alguna información sobre el modelo que a uno le interesa? Si hubiera modelos de interés que no entran en esa caracterización, puedo entender que esa caracterización transmita información. Pero la única caracterización que se me ocurre que no sea la media condicional es una fuente de ruido puro. Pero como he dicho, soy nuevo en el campo, así que creo que me debo estar perdiendo todo un cuerpo de modelos (de interés).

Fíjate en que he llegado a la media condicional preguntándome a mí mismo:

¿Qué es algo sencillo que me gustaría saber sobre la distribución de Y dado que ya sé X ?

Bueno, hay muchas cosas que podría preguntar:

  • ¿Cuál es la media de Y dado X ?
  • ¿Cuál es la mediana de Y dado X ?
  • ¿Cuál es el 90 percentil de Y dado X ?

Todas estas preguntas son válidas, y existe un modelo para cada una de ellas. Para obtener la media condicional de Y dado X, se minimiza el error cuadrático esperado:

E(YX)=argminfE((Yf(X))2)

Para llegar a la mediana condicional se minimiza el error absoluto esperado:

Median(YX)=argminfE(|Yf(X)|)

Para llegar al percentil 90 hay que hacer algo más inteligente. Los dos últimos casos están cubiertos por una teoría llamada regresión cuantil . Tiene buenas propiedades, como la resistencia a los valores atípicos y la asimetría, al igual que la mediana.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X