He aquí una breve introducción a las tablas de contingencia 2x2.
En primer lugar, hay que pensar en la forma de presentar los datos. Un enfoque es rellenar una tabla de contingencia de 2x2 en la que las columnas indican si hay o no gripe y las filas indican si hay o no un segundo patógeno. El otro enfoque es decir presentar porcentajes para dos grupos: el porcentaje de personas con el patógeno para los que tienen la gripe, $p_f$ y el porcentaje de personas con el patógeno por las que no tienen gripe, $p_w$ .
En segundo lugar, ahora puede pensar en dos preguntas de investigación diferentes. (1) ¿Existe alguna relación entre la gripe y el patógeno? (2) ¿Son los porcentajes $p_f$ y $p_w$ ¿Igual o no? La primera puede responderse con una prueba de independencia de chi-cuadrado, la segunda con una prueba de hipótesis de proporciones de dos muestras. Resulta que, en realidad, son lo mismo desde el punto de vista matemático, aunque sus fórmulas pueden parecer muy diferentes.
En tercer lugar, la prueba de hipótesis no es lo mismo que una evaluación de la significación práctica. Para ello, se puede informar de la $\phi$ -(que no es más que la correlación de los unos y los ceros de cada variable) u otra medida del tamaño del efecto, como la de Cramer $V$ . Son intentos de medir la fuerza de la relación entre las variables (muy parecido a una correlación, pero para variables dicotómicas).
Otra forma de entender la importancia práctica de la comparación es el odds ratio (OR). Por ejemplo, si la probabilidad de tener el agente patógeno con la gripe es del 60% y la probabilidad de tener el agente patógeno sin la gripe es del 50%, la OR sería 0,6/0,5 = 1,2. Esto significa que los que tienen la gripe tienen el patógeno un 20% más que los que no la tienen. Sin embargo, esto debe interpretarse con precaución, ya que la ocurrencia del 6% y del 5% daría como resultado la misma OR.
Por último, es posible realizar una regresión logística en la que el único predictor del modelo sea la variable dicotómica. Digamos que se desea predecir la presencia del patógeno a partir de tener la gripe o no. El modelo utilizaría la variable dicotómica gripe (0/1) como único predictor. Este es un enfoque de modelización comparable al enfoque de prueba de hipótesis indicado anteriormente.
Estaré encantado de ampliar cualquiera de estas cuestiones en los comentarios o mediante una respuesta revisada.