Processing math: 100%

11 votos

Prueba exacta de Fisher para datos emparejados

Dado 40 casos de cáncer de pulmón y 40 controles emparejados (sin cáncer de pulmón) (emparejamiento basado en la edad, el sexo, etc.). Para tratar de encontrar pruebas entre el efecto del tabaquismo y el cáncer de pulmón, utilicé la prueba exacta de Fisher en la tabla de contingencia. Sin embargo, esto no tuvo en cuenta que los controles y los casos estaban emparejados.

Así que me pregunto si hay una forma de utilizar la prueba exacta de Fisher que tenga en cuenta la coincidencia entre los dos grupos.

9voto

rnso Puntos 2424

Necesita la prueba de McNemar ( http://en.wikipedia.org/wiki/McNemar%27s_test , http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3346204/ ). A continuación, un ejemplo:

Se estudian 1300 pts y 1300 controles emparejados. El estado de tabaquismo se presenta de la siguiente manera:

             Normal   
           |no  |yes|
Cancer|No  |1000|40 |
      |Yes |200 |60 |

Cada entrada de la tabla muestra información sobre un PAR CASO-CONTROL: 1000 significa que en 1000 pares caso-control, ninguno era fumador. 40 es el número de pares caso-control donde el control era fumador y el paciente con cáncer no lo era, y así sucesivamente. El siguiente código R se puede utilizar para generar esta tabla y hacer la prueba de McNemar.

mat = as.table(rbind(c(1000, 40), c( 200, 60) ))
colnames(mat) <- rownames(mat) <- c("Nonsmoker", "Smoker")
names(dimnames(mat)) = c("Cancer", "Normal")
mat
#                  Normal
#              Nonsmoker Smoker
# Cancer
#  Nonsmoker      1000     40
#  Smoker          200     60

mcnemar.test(mat)

#        McNemar's Chi-squared test with continuity correction
#
#data:  mat
#McNemar's chi-squared = 105.34, df = 1, p-value < 2.2e-16

La prueba de McNemar también se utiliza para evaluar el efecto de una intervención en una variable de resultado binaria. El par de resultados antes-después se tabula y se prueba como en el caso anterior.

Editar: Ampliando el ejemplo dado por @gung , si el estatus de fumador aparece en su dataframe mydf de la siguiente manera:

pairID  cancer  control
1       1       1
2       1       1
3       1       0
...

La prueba de McNemars se puede realizar con los siguientes comandos de R:

> tt = with(mydf, table(cancer, control))
> tt
      control
cancer 0 1
     0 5 1
     1 3 2

> mcnemar.test(tt)

        McNemar`s Chi-squared test with continuity correction

data:  tt
McNemar`s chi-squared = 0.25, df = 1, p-value = 0.6171

0 votos

¿Qué prueba se utiliza para múltiples controles por caso, digamos 10 controles por caso?

0 votos

Esto merecería una pregunta y un debate aparte. Creo que se puede emparejar cada caso con la media de sus controles y luego utilizar la prueba de McNemar.

7voto

Sean Hanley Puntos 2428

Tiene razón en que la prueba exacta de Fisher es inadecuada para sus datos. Tendrás que volver a formar tu tabla de contingencia. La nueva tabla será para pares Así, parecerá que tiene la mitad de datos representados (en su caso, 40 en lugar de 80). Por ejemplo, imagine que sus datos tienen este aspecto (cada conjunto de sujetos emparejados está en su propia fila, y 1 indica que es fumador):

cancer  control
1       1
1       1
1       0
1       0
1       0
0       1
0       0
0       0
0       0
0       0
0       0

Entonces su antigua tabla de contingencia podría haber sido:

       cancer  control
smoker 5       3
non    6       8

Su nueva tabla de contingencia tendrá el siguiente aspecto:

            control
cancer    smoker  non           
  smoker  2       3
  non     1       5

La primera tabla de contingencia suma 22 (el número de sujetos totales en su estudio), pero la segunda tabla de contingencia suma 11 (el número de pares emparejados).

Con sus datos representados de esta manera, lo que le interesa es si las proporciones marginales son las mismas. La prueba para ello es Prueba de McNemar . He explicado la prueba de McNemar aquí y aquí .

1 votos

Tenga en cuenta que la prueba de McNemar para datos dicotómicos es equivalente a la prueba de signos. Así que el PO puede utilizar la prueba de signos (con pruebas de permutación o de significación de Monte Carlo, si es necesario).

1 votos

@ttnphns, eso lo comento en los hilos enlazados donde explico con detalle el test de McNemar.

1voto

paradigmatic Puntos 20871

No debería ser necesario utilizar una prueba emparejada. el emparejamiento de las poblaciones asegura que la distribución de covaraites (edad, ...) es la misma en las dos poblaciones por lo que no "distorsiona" la imagen.

la prueba compara las medias de las poblaciones, por lo que no es necesario un emparejamiento de individuos. esto sólo es necesario para las mediciones "repetidas", por ejemplo, la comparación de menas antes y después del tratamiento de la misma población.

0voto

Guest Puntos 1

Sí y no:

probablemente su caso cae bajo la Pearce (2015) caso: lo que dice el artículo es que las variables que utilices para seleccionar el control deben controlarse en el estudio y no en la prueba. Eso podría ser difícil debido al N=80.

Espero que esto ayude :)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X