8 votos

Cómo expresar las células de una tabla de 2 x 2 en términos de coeficiente de phi y probabilidades marginales

Considere la posibilidad de una típica tabla de 2x2 de frecuencias (que se muestra en esta imagen):
two by two table
Notación: La fila de la variable se denota R y toma los valores 0 o 1; la columna de la variable se denota C y toma los valores 0 o 1. Las celdas de la tabla indican la frecuencia de cada combinación de R y C; por ejemplo, $b$ es la frecuencia de R=0 y C=1. Para los propósitos de mi pregunta, se supone que el recuento de células se dividen por el total, por lo que los valores de celda son las probabilidades conjunta de las células.

Quiero expresar la celda de probabilidades en términos de la phi coeficiente (que es una medida de la correlación con la formula siguiente) y las probabilidades marginales: $\mu_R\equiv p(R\!=\!1) = c+d$$\mu_C\equiv p(C\!=\!1) = b+d$. Es decir, quiero invertir el siguiente sistema de cuatro ecuaciones: $$\begin{align} \phi &\equiv (ad-bc)/\sqrt{(a+b)(c+d)(a+c)(b+d)} \tag{by defn}\\ \mu_{R} &= c+d \tag{by defn}\\ \mu_{C} &= b+d \tag{by defn}\\ 1 &= a+b+c+d \tag{constraint} \end{align}$$ y, por supuesto, $0 \le a,b,c,d \le 1$. En otras palabras, me gustaría resolver para $a$, $b$, $c$, y $d$ en términos de $\phi$, $\mu_{R}$, y $\mu_{C}$.

Este problema probablemente ha sido resuelto por alguien antes, pero mis investigaciones no han arrojado una fuente, y mis débiles intentos de álgebra, no ha producido una respuesta, y no puedo encontrar el sistema en línea de(no lineal)-ecuación de inversores que manejan este caso.

4voto

jldugger Puntos 7490

Podemos reconocer fácilmente cada factor en el denominador de $\phi$, debido a $a+b=1-\mu_R$$a+c=1-\mu_C$. Vamos a comenzar con una pequeña simplificación de evitar tener que escribir un montón de raíces cuadradas:

$$\Delta=ad - bc = \phi \sqrt{\mu_R(1-\mu_R)\mu_C(1-\mu_C)}.$$

Vamos a encontrar a $d$:

$$\eqalign{d &= (1)d = (a+b+c+d)d = ad +bd +cd + d^2 \\ &= ad + (-bc + bc) + bd + cd + d^2 \\ y= (ad - bc) + (c+d)(b+d) \\&= \Delta + \mu_R\mu_C.}$$

Encontrar $a$, $b$, y $c$ procede de manera similar debido a las simetrías del problema: intercambiando las columnas de swaps $a$ y $b$, $c$ y $d$, mientras que el cambio de $\mu_C$ $1-\mu_C$y la negación de la $\Delta$, de donde $$c = -\Delta + \mu_R(1-\mu_C).$$

Intercambiando las filas de los swaps $a$ y $c$, $b$ y $d$, mientras que el cambio de $\mu_R$ $1-\mu_R$y la negación de la $\Delta$, de donde

$$b = -\Delta + (1-\mu_R)\mu_C.$$

Intercambio de filas y columnas de los rendimientos

$$a = \Delta + (1-\mu_R)(1-\mu_C).$$


Dado que estas expresiones para $a,b,c,d$, es simple comprobar que $a+b+c+d=1, c+d=\mu_R,$$b+d=\mu_C$, y sólo un poco más difícil para comprobar que $ad-bc=\Delta$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X