4 votos

Dos distribuciones normales

Marcaré esto como tarea, aunque sólo sea de interés general. El escenario es un poco tonto, porque es sólo un caso del mundo real para un problema teórico en el que he estado pensando.

Un hombre se presenta cada año a un concurso de comer perritos calientes y en el concurso tiene que comerse 10 perritos calientes en 5 minutos (sí, es diferente a los concursos normales de perritos calientes):

En cuanto el hombre se come su 5º perrito caliente (a medio camino de acabárselos) se registra el tiempo, y cuando se come su último perrito caliente se vuelve a registrar el tiempo. Así que tenemos dos conjuntos de datos que se pueden aproximar con distribuciones normales, es decir, cuánto se tarda en comer 5 perritos calientes y cuánto en comer 10.

Llame a la primera media y std dev $\mu_{h}, \sigma_{h}$ (h para la mitad) y la media y desviación estándar de la segunda distribución $\mu_{f}, \sigma_{f}$ . Ambas medias se expresan en minutos.

Este año el hombre se presenta al concurso y se ve que lleva $\mu_{h} +\epsilon$ minutos para terminar el quinto perrito caliente, por alguna $\epsilon > 0$ es decir, es más lento de lo habitual.

Mi pregunta es, ¿a qué hora podemos esperar que el hombre dos termine el concurso, y cómo calcular esto? Pensando en ello, he pensado que lo mejor sería considerar las dos distribuciones como una distribución normal bivariante. Así que si tenemos la primera variable aleatoria $X$ como el tiempo que se tarda en llegar a la mitad del camino, y $Y$ como el tiempo que se tarda en terminar, quiero $E(Y|X =\mu_{h} +\epsilon )$ .

No sé si esto es pensar correctamente, por favor corríjanme si me equivoco. Tampoco sé cómo calcular el valor esperado anterior. Cualquier ayuda es bienvenida.

3voto

AdamSane Puntos 1825

Sólo una nota sobre el cálculo de este tipo de expectativas condicionales.

Voy a usar una notación diferente a la tuya, porque ya he tratado este problema antes (en dos contextos bastante diferentes) y quiero usar la notación en la que estoy acostumbrado a jugar con él (donde ni siquiera estamos tratando con el tiempo, sino con una cosa diferente que se acumula).

Llama a los 5 primeros perritos calientes "tarea 1" y a los 5 siguientes "tarea 2".

Sea $X$ el tiempo necesario para terminar la primera tarea, y $Y$ el tiempo para terminar la segunda tarea (así $X+Y$ es el momento de terminarlo todo).

Tras la primera tarea, observamos $X=x$ . Queremos $\text{E}(X+Y|X=x)$ .

$$\text{E}(X+Y|X=x) = \text{E}(X|X=x) + \text{E}(Y|X=x) = x + \text{E}(Y|X=x)$$

Ahora, ¿qué hacemos con $\text{E}(Y|X=x)$ ?

Si $X$ et $Y$ son independientes, podemos simplemente poner $\mu_Y$ ; si son casi independientes será una buena aproximación.

(que resulta ser una aproximación sorprendentemente buena en una de esas tareas)

De forma más general, podrías hacer algo como la expectativa condicional en una normal bivariante (ya que mencionas dos normales):

$$\text{E}(Y|X=x) = \mu_Y + \text{Cov}(X,Y) \text{Var}(X)^{-1} (x-\mu_X) $$

(Si esto parece una regresión, no es casualidad).

En su caso, el último término entre paréntesis sería $\epsilon$ .

Así que terminas por el tiempo total con $x + \mu_Y + \gamma(x-\mu_X)$ donde $\gamma$ es esencialmente un coeficiente de regresión de la población.

Por lo tanto, para predecir lo que ocurre con la expectativa en la segunda tarea en función de lo que ocurrió en la primera, es necesario saber cómo covarían en relación con la varianza de la primera tarea. (De hecho, esto sugiere que si no conoce estas cantidades, debería estimar la relación a partir de los datos mediante regresión. Sin embargo, si ya conoce/puede suponer la correlación o la covarianza, puede escribir la ecuación correspondiente).

(He pasado por alto algunas de las suposiciones implicadas).

3voto

Eero Puntos 1612

Si se acepta la hipótesis de la normalidad bivariante (y a mí me parece una aproximación razonable), el valor esperado de Y dado X no es más que la predicción de un modelo de regresión lineal. Las fórmulas estándar para la regresión lineal se pueden derivar suponiendo que los valores de X son fijos o que X e Y son normales bivariantes; en cualquier caso, las fórmulas para los coeficientes de regresión son las mismas.

Si tienes datos del pasado, puedes introducirlos en una rutina de regresión y hacer una predicción.

Si no tienes datos, sino los parámetros de la normal bivariante (2 medias, 2 varianzas (o desviaciones típicas) y una covarianza (o correlación)), puedes introducirlos en las fórmulas y obtener la ecuación de regresión con la que predecir.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X