5 votos

¿Cómo se obtiene esta fórmula de la varianza?

Existe una fórmula para la varianza del flujo de tráfico entre A y B, calculada a partir de datos de muestra, que se cita en el Manual de Evaluación del Tráfico del Reino Unido. No se da ninguna prueba y una parte de mí realmente quiere saber cómo se obtiene esta fórmula. He pasado un par de horas intentándolo, pero he fracasado estrepitosamente y tampoco encuentro nada en Internet. Les agradecería mucho que me ayudaran.

El formulario del Manual es: $$ Var(Q_{AB})=\frac{Q(Q-q)}{q^2(q-1)}\cdot{}q_{AB}(q-q_{AB}) $$

Dónde $Q$ es el caudal total en el punto de medición, $q$ es el flujo encuestado (es decir, el tamaño de la muestra), $q_{AB}$ es el muestra flujo que va de A a B, y $Q_{AB}$ es el flujo total de A a B.

Esto se puede reordenar en la forma más intuitiva de: $$ Var(Q_{AB})=\frac{(Q-q)\cdot{}Q\cdot{}p_{AB}\cdot{}(1-p_{AB})}{q-1} $$

Dónde $p_{AB}$ es la proporción de tráfico de la muestra que viaja de A a B.

Aunque esto parece más lógico, todavía no puedo entender cómo esto viene de la fórmula para la varianza de la distribución binomial, que pensé que sería $$Var(Q_{AB})=\frac{p_{AB}(1-p_{AB})}{q-1}$$

Gracias de antemano por cualquier ayuda.

Para los curiosos, la sección del manual en cuestión está aquí: Screen capture of clauses D13.2 and D13.3 from DMRB Volume 12 Section 1 Part 1

2voto

Confusión en la notación

Hay bastante confusión en las fórmulas. Por ejemplo, estimamos $Q_a$ vía $\frac{q_a}{q}Q$ y tratarla como una variable aleatoria. Suponiendo $Q,q$ son escalares conocidos, y $q_a$ es una variable aleatoria, la fuente de aleatoriedad dentro de $Q_a$ proviene de $q_a$ y se cumple lo siguiente:

$$\operatorname{var}(Q_a)=\frac{Q^2}{q^2}\operatorname{var}(q_a)$$

La fórmula anterior es función de $Q$ y $q$ Sin embargo, la fórmula de Manual de evaluación del tráfico del Reino Unido contiene todos los términos, es decir $Q, q$ y $q_a$ . Así, la variable aleatoria $q_a$ también aparece en la fórmula final. Es como decir $\operatorname{var}(X)\propto \alpha X$ que en general no es correcto, ya que el resultado debería haber sido un escalar en lugar de una cantidad aleatoria. Si la fórmula hubiera significado realmente $\operatorname{var}(Q_a|q_a)$ para que tengamos derecho a utilizar $q_a$ en la expresión de salida, entonces la varianza debería haber sido $0$ ya que no queda ninguna otra aleatoriedad en la expresión de $q_a$ es decir $\operatorname{var}(X|X)=0.$

Así pues, aunque la intuición es clara, es decir, calcular una medida de incertidumbre en la estimación del número real de coches que tienen el atributo de interés, la fórmula no tiene sentido en el análisis.

Una fórmula aproximada

La situación se asemeja a distribución hipergeométrica aunque en ese $Q,q,Q_a$ son conocidos. Aquí, no sabemos $Q_a$ y estimarlo mediante una fórmula sencilla, que es también el estimador del método de los momentos para $Q_a$ . Digamos que el verdadero número de coches que interesan es $R$ (ya que nos reservamos $Q_a$ para la estimación, es decir $\hat R=Q_a$ ). Entonces, la varianza de $q_a$ se da en la página de la wikipedia de la siguiente manera: $$\operatorname{var}(q_a)=q\frac{R}{Q}\frac{Q-R}{Q}\frac{Q-q}{Q-1}\rightarrow\operatorname{var}(Q_a)=\frac{R(Q-R)(Q-q)}{q(Q-1)}$$

Pero, no sabemos $R$ por lo que no podemos cuantificar esta fórmula. Algo sencillo es simplemente introducir su estimación, es decir $R\approx \hat R=Q_a=q_aQ/q$ en la fórmula: $$\operatorname{var}(Q_a)\approx \frac{Q}{(Q-1)}\frac{Q(Q-q)}{q^3}q_a(q-q_a)=\frac{Q(q-1)}{(Q-1)q}\underbrace{\frac{Q(Q-q)}{q^2(q-1)}q_a(q-q_a)}_{\text{Given Formula}}$$

Esta fórmula es muy parecida a la que se da en el manual, el multiplicador del principio se puede suponer realmente cercano a $1$ si ambos $q$ y $Q$ se suponen suficientemente grandes, ya que $\frac{q}{q-1}\approx \frac{Q}{Q-1}$ .

Vía bayesiana

Como ya he dicho, se trata de un aproximación a la varianza. Para cuantificar correctamente la varianza, se requiere una distribución a priori sobre $R$ debe estar presente. Entonces, la fórmula que encontramos arriba sería $\operatorname{var}(Q_a|R)$ y podríamos utilizar la ley de la varianza total para hallar la varianza de $Q_a$ :

$$\operatorname{var}(Q_a)=E[\operatorname{var}(Q_a|R)]+\operatorname{var}(E[Q_a|R])$$

Aquí, el primer término es un simple valor esperado $E[R(Q-R)]\frac{Q-q}{q(Q-1)}$ y el segundo término es $$\operatorname{var}(E[Q_a|R])=\operatorname{var}(E[q_aQ/q|R])=\operatorname{var}(R)$$

dependiendo ambos de la distribución a priori de $R$ . No creo que haya ninguna explícitamente asumida en el documento.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X