Sin hacer suposiciones adicionales, hay poco se puede decir.
La idea detrás de los ejemplos dados aquí es que en la regresión de $A$ contra $B$, podemos tomar un poco pequeño de la gama de $B$ (para el que hay una baja probabilidad de $q$) y alterar drásticamente la distribución condicional de $A$ en ese rango, sin cambiar nada de la parte inferior de bivariante momentos muy mucho.
La distribución Normal bivariante, cuya densidad se muestra como un gráfico de contorno en la izquierda, ha sido alterado dentro de una estrecha franja horizontal de ($B$) valores de desplazamiento vertical ($A$) densidades hacia arriba. Para compensar, (1) el resto de la densidad se desplaza ligeramente hacia abajo (por lo tanto el reequilibrio de la expectativa de $A$) y (2) el resto de la densidad fue contratado en la dirección vertical (por lo tanto la reducción de la varianza global de $A$ para compensar el ligero aumento causado por la inicial de cambio dentro de la franja).
Haciendo la tira lo suficientemente estrecha, podemos cambiar tanto la probabilidad de $A$ como queremos arbitrariamente mucho (arriba o abajo), manteniendo la compensación de los efectos sobre el resto de la distribución arbitrariamente pequeño. (Además, por situar la franja de cerca de la mitad (horizontalmente), también podemos organizar para no perturbar el coeficiente de correlación si se quiere.)
El siguiente ejemplo claro lleva esta idea al extremo de que por suponer tanto $A$ $B$ tiene sólo dos posibles valores de cada uno, pero no hay nada especial acerca de este caso extremo.
Suponga $\sigma_A$ $\sigma_B$ son ambos cero. Dado cualquier valor distinto de cero números de $x\gt 0$$y$$0\lt q \lt 1$, definen una distribución bivariante para $(A,B)$ como sigue:
$$\eqalign{
\Pr((a,B)=(0,0)) &= q/2 \\
\Pr((a,B)=(x,0)) &= q/2 \\
\Pr((a,B)=(0,y)) y= 1-q.
}$$
Esto hace que $A$ varios $x$ de Bernoulli$(q/2)$ variable y $B$ es un múltiplo $y$ de Bernoulli$(1-q)$ variable. Por lo tanto
$$\sigma^2_A = x^2\left(\frac{p}{2}\right)\left(1-\frac{p}{2}\right);\quad
\sigma^2_B = y^2 p(1-p).$$
Estos determinan $x^2$ $y^2$ en términos de $q$ y el de las varianzas:
$$x^2 = \frac{4\sigma^2_A}{q(2-q)};\quad y^2 = \frac{\sigma^2_B}{q(1-q)}.$$
A partir de la definición de esperanza condicional
$$\mathbb{E}(A|B=0) = \frac{0(q/2) + x(q/2)}{q/2 + q/2} = \frac{x}{2} = \frac{\sigma_A}{\sqrt{q(2-q)}}.\tag{1}$$
Obviamente podemos hacer el lado derecho tan grande como se desee, haciendo $q$ suficientemente pequeño. Rigurosamente, si $N \gt 0$, pick $q \gt 0$ tal que $q \lt \sigma^2_A/(2N^2)$, por lo que
$$q(2-q) = 1-(1-q)^2 \lt 1-(1-\sigma^2_A/(2N^2))^2 = \frac{\sigma^2_A}{N^2} - \left(\frac{\sigma_A^2}{2N^2}\right)^2 \lt \frac{\sigma^2_A}{N^2},$$
lo que implica (a partir de la expresión de $(1)$) que
$$\mathbb{E}(A|B=0) = \frac{\sigma_A}{\sqrt{q(2-q)}} \gt \frac{\sigma_A}{\sigma_A/N} = N.$$
De este modo podemos seleccionar $q$ para que coincida con las variaciones de la distribución de $(A,B)$ mientras que la toma de $\mathbb{E}(A|B=0)$ arbitrariamente grande.