5 votos

¿Se puede mejorar la prueba de McNemar con ajustes de ceros como los de una prueba de signos?

La prueba de McNemar es un ejemplo especial de la prueba de signos binomiales pero la prueba del signo ('vainilla') sufre de sesgo por ignorar las diferencias iguales a cero.

La estadística de la prueba de McNemar está dada por:

$ \chi ^{2} = \frac { \left (|r-s|-1 \right )^{2}}{r+s}$ donde $r$ y $s$ son los recuentos de pares discordantes (0,1) frente a (1,0), distribuidos $ \chi ^{2}$ con un grado de libertad bajo la hipótesis nula.

Me está costando mucho analizar a Sribney en la prueba de signos:

La estadística de la prueba de signos es el número $n_{+}$ de observaciones mayores que cero. Suponiendo que la probabilidad de que una observación sea igual a cero es exactamente cero, entonces, bajo la hipótesis nula, $n_{+} \sim \text {Binomial}(n, p= \frac {1}{2})$ donde $n$ es el número total de observaciones. ¿Pero qué hacemos si tenemos algunas observaciones que son cero?

El principio de aleatoriedad de Fisher

Tenemos una respuesta preparada para esta pregunta si vemos la prueba desde la perspectiva del Principio de Aleatoriedad de Fisher (Fisher 1935). La idea de Fisher (enunciada de manera moderna) era examinar una familia de transformaciones de los datos observados de manera que la probabilidad a priori (bajo la hipótesis nula) de los datos transformados es la misma que la probabilidad de los datos observados. La distribución de la estadística de prueba se produce entonces calculando su valor para cada uno de los conjuntos de datos de "aleatorización" transformados, considerando que cada conjunto de datos es igualmente probable.

Para la prueba de signos, los "datos" son simplemente el conjunto de signos de las observaciones. Bajo la hipótesis nula de la prueba de signos, $P(X_{i}>0)= P(X_{i}<0)$ para que podamos transformar los signos observados volteando cualquier número de ellos y el conjunto de signos tendrá la misma probabilidad. El $2^{n}$ posibles cambios de signo de la familia de conjuntos de datos de aleatorización. Si no tenemos ceros, este procedimiento lleva de nuevo a $n_{+} \sim \text {Binomial}(n, p= \frac {1}{2})$ .

Si tenemos ceros, cambiar sus signos los deja como ceros. Así que si observamos $n_{0}$ ceros, cada uno de los $2^{n}$ Los conjuntos de datos de cambio de signo también tendrán $n_{0}$ Ceros. Por lo tanto, los valores de $n_{+}$ calculados sobre los conjuntos de datos de cambio de signo van de 0 a $n-n_{0}$ y la distribución "aleatoria" de $n_{+}$ es $n_{+} \sim \text {Binomial}(n-n_{0}, p= \frac {1}{2})$ .

Porque esto parece estar diciendo que hay que seguir adelante e ignorar los ceros. Pero más tarde en el periódico, Sribney proporciona un ajuste para la prueba de rango de signos que da cuenta de ceros justo en la línea que me estoy preguntando:

El ajuste para los ceros es el cambio en la variación cuando se firman los rangos para los ceros para hacer $r_{j}=0$ es decir, la variación se reduce en $ \frac {1}{4} \sum_ {i=1}^{n-{0}}{i^{2}}=n_{0} \frac { \left (n_{0}+1 \right ) \left (2n_{0}+1 \right )}{24}$ .

¿Debería preguntarme si debo o no aplicar la prueba de rango firmado a los datos de control de casos individuales?

Un simple ejemplo inventado ilustrará por qué ignorar los ceros representa un problema. Imagine que ha emparejado datos sin diferencias iguales a cero (esto correspondería a los datos de una prueba de McNemar con sólo pares discordantes presentes). Con un tamaño de muestra de, digamos, 20, encuentras 15 signos positivos de diferencias y 5 signos negativos de diferencias, y concluyes que hay una diferencia significativa. Ahora imagina que tienes 1000 diferencias observadas iguales a cero además de esos 15 signos positivos y 5 negativos de diferencias: ahora concluyes que la diferencia no es significativa. Si la prueba de McNemar se realiza sobre 1020 pares, 1000 de los cuales son ceros, y con pares discordantes de 15 y 5, no debemos rechazar la hipótesis nula (por ejemplo, en $ \alpha = 0.05$ ).

Hay un ajuste en la prueba de los signos para corregir las diferencias cero observadas, basado en el "Principio de Aleatorización" de Fisher (Sribney, 1995).

¿Hay alguna forma de mejorar la prueba de McNemar que aborda el efecto de las diferencias cero observadas (es decir, contabilizando el número de pares concordantes en relación con el número de pares discordantes)? ¿Cómo? ¿Qué hay de la asintótica z aproximación para la prueba de signos?

Referencias

Sribney WM. (1995) Corrigiendo los empates y ceros en las pruebas de signo y rango. Boletín Técnico de Stata . 26:2–4.

6voto

Uri Puntos 111

E.L. Lehmann, J.P. Romano. Comprobación de las hipótesis estadísticas . 3ª ed. Springer, 2005. P. 136:

P(-), P(+) y P(0) denotan las probabilidades de preferencia del producto [A sobre B, B sobre A, o A=B, empate], ... La hipótesis a probar H0: P(+)=P(-) ... El problema se reduce a la prueba de la hipótesis P=1/2 en un distribución binomial con n-z [n = tamaño de la muestra, z = número de lazos] los juicios... La prueba imparcial se obtiene, por lo tanto, haciendo caso omiso de la número de casos sin preferencia (empates), y aplicando la prueba de signos a los datos restantes.

La potencia de la prueba depende fuertemente de P(0) ... Para P(0) grande, el número n-z de ensayos en la distribución binomial condicional [en z] puede esperarse que sea pequeño, y la prueba por lo tanto tendrá poca potencia ... Un valor suficientemente alto de P(0), independientemente del valor de P(+)/P(-), implica que la población en su conjunto es en gran medida indiferente con respecto al producto.

Como tratamiento alternativo de las ataduras, a veces se propone asignar cada empate al azar (con probabilidad 1/2 cada uno) a cualquiera de los más o menos... La hipótesis H0 se convierte en P(+)+1/2P(0)=1/2 ... Esta prueba puede ser visto también como una prueba aleatoria... y es imparcial para probando H0 en su forma original ... [Pero] Dado que la prueba implica aleatoria que no sea en los límites de la región de rechazo, se es menos poderoso que la [prueba original sin tener en cuenta las ataduras]..., por lo que el La ruptura aleatoria de los lazos resulta en una pérdida de poder.

2voto

Sean Hanley Puntos 2428

No veo cómo esto podría ser útil, o incluso posible. La prueba de McNemar sólo usa los pares discordantes. La página de Wikipedia dice:

El McNemar estadística de prueba es: $$ \chi ^2 = {(b-c)^2 \over b+c}. $$

Tengo una larga explicación de la prueba de McNemar aquí: ¿Cuál es la diferencia entre el test de McNemar y el test de chi-cuadrado, y cómo sabes cuándo usar cada uno? Todo el puesto puede ser de valor, pero tomando prestado el ejemplo allí:

\begin {arriba} {rrrrrr} & &{ \rm Después} & & & & \\ & &{ \rm No} &{ \rm Sí} & &{ \rm total} \\ { \rm Antes}&{ \rm No} &1157 &35 & & &1192 \\ &{ \rm Sí} &220 &13 & &233 \\ & & & & & \\ &{ \rm total} &1377 &48 & &1425 \\ \end {\i1}{\b1}{\b1}{\b1}{\b1}Aquí.{\b}{\b}{\b1}

La prueba de McNemar es la prueba binomial de $220/(220+35)$ los pares concordantes (es decir, $1157$ y $13$ ) no aparezcan.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X