La prueba de McNemar es un ejemplo especial de la prueba de signos binomiales pero la prueba del signo ('vainilla') sufre de sesgo por ignorar las diferencias iguales a cero.
La estadística de la prueba de McNemar está dada por:
$ \chi ^{2} = \frac { \left (|r-s|-1 \right )^{2}}{r+s}$ donde $r$ y $s$ son los recuentos de pares discordantes (0,1) frente a (1,0), distribuidos $ \chi ^{2}$ con un grado de libertad bajo la hipótesis nula.
Me está costando mucho analizar a Sribney en la prueba de signos:
La estadística de la prueba de signos es el número $n_{+}$ de observaciones mayores que cero. Suponiendo que la probabilidad de que una observación sea igual a cero es exactamente cero, entonces, bajo la hipótesis nula, $n_{+} \sim \text {Binomial}(n, p= \frac {1}{2})$ donde $n$ es el número total de observaciones. ¿Pero qué hacemos si tenemos algunas observaciones que son cero?
El principio de aleatoriedad de Fisher
Tenemos una respuesta preparada para esta pregunta si vemos la prueba desde la perspectiva del Principio de Aleatoriedad de Fisher (Fisher 1935). La idea de Fisher (enunciada de manera moderna) era examinar una familia de transformaciones de los datos observados de manera que la probabilidad a priori (bajo la hipótesis nula) de los datos transformados es la misma que la probabilidad de los datos observados. La distribución de la estadística de prueba se produce entonces calculando su valor para cada uno de los conjuntos de datos de "aleatorización" transformados, considerando que cada conjunto de datos es igualmente probable.
Para la prueba de signos, los "datos" son simplemente el conjunto de signos de las observaciones. Bajo la hipótesis nula de la prueba de signos, $P(X_{i}>0)= P(X_{i}<0)$ para que podamos transformar los signos observados volteando cualquier número de ellos y el conjunto de signos tendrá la misma probabilidad. El $2^{n}$ posibles cambios de signo de la familia de conjuntos de datos de aleatorización. Si no tenemos ceros, este procedimiento lleva de nuevo a $n_{+} \sim \text {Binomial}(n, p= \frac {1}{2})$ .
Si tenemos ceros, cambiar sus signos los deja como ceros. Así que si observamos $n_{0}$ ceros, cada uno de los $2^{n}$ Los conjuntos de datos de cambio de signo también tendrán $n_{0}$ Ceros. Por lo tanto, los valores de $n_{+}$ calculados sobre los conjuntos de datos de cambio de signo van de 0 a $n-n_{0}$ y la distribución "aleatoria" de $n_{+}$ es $n_{+} \sim \text {Binomial}(n-n_{0}, p= \frac {1}{2})$ .
Porque esto parece estar diciendo que hay que seguir adelante e ignorar los ceros. Pero más tarde en el periódico, Sribney proporciona un ajuste para la prueba de rango de signos que da cuenta de ceros justo en la línea que me estoy preguntando:
El ajuste para los ceros es el cambio en la variación cuando se firman los rangos para los ceros para hacer $r_{j}=0$ es decir, la variación se reduce en $ \frac {1}{4} \sum_ {i=1}^{n-{0}}{i^{2}}=n_{0} \frac { \left (n_{0}+1 \right ) \left (2n_{0}+1 \right )}{24}$ .
¿Debería preguntarme si debo o no aplicar la prueba de rango firmado a los datos de control de casos individuales?
Un simple ejemplo inventado ilustrará por qué ignorar los ceros representa un problema. Imagine que ha emparejado datos sin diferencias iguales a cero (esto correspondería a los datos de una prueba de McNemar con sólo pares discordantes presentes). Con un tamaño de muestra de, digamos, 20, encuentras 15 signos positivos de diferencias y 5 signos negativos de diferencias, y concluyes que hay una diferencia significativa. Ahora imagina que tienes 1000 diferencias observadas iguales a cero además de esos 15 signos positivos y 5 negativos de diferencias: ahora concluyes que la diferencia no es significativa. Si la prueba de McNemar se realiza sobre 1020 pares, 1000 de los cuales son ceros, y con pares discordantes de 15 y 5, no debemos rechazar la hipótesis nula (por ejemplo, en $ \alpha = 0.05$ ).
Hay un ajuste en la prueba de los signos para corregir las diferencias cero observadas, basado en el "Principio de Aleatorización" de Fisher (Sribney, 1995).
¿Hay alguna forma de mejorar la prueba de McNemar que aborda el efecto de las diferencias cero observadas (es decir, contabilizando el número de pares concordantes en relación con el número de pares discordantes)? ¿Cómo? ¿Qué hay de la asintótica z aproximación para la prueba de signos?
Referencias
Sribney WM. (1995) Corrigiendo los empates y ceros en las pruebas de signo y rango. Boletín Técnico de Stata . 26:2–4.