7 votos

¿La supresión de la lista / el análisis de caso completo es parcial si los datos no faltan completamente al azar?

En los comentarios a la respuesta a mi pregunta me dijo "Muchas filas tienen sólo 1 falta variable, por lo que para excluir la fila de pensar lleva a los prejuicios (que no son MCAR)" , y en respuesta me dijeron "Usted está equivocado, véase Rubin, un Análisis Estadístico con los Datos que Faltan 2ª ed. CC es imparcial con MAR de datos"

No tengo Rubin y Poco del libro, pero yo había sido capaz de pedir prestado un par de meses y estoy seguro de que me enteré de que complete el análisis de casos es sesgada a menos que los datos faltan completamente al azar.

Ahora estoy terriblemente confundido.

¿Alguien puede explicar o aclarar mi malentendido ?

4voto

Bruce ONeel Puntos 391

No está mal.

De: Análisis estadístico con los Datos que Faltan, Segunda Edición, Roderick J. A. Little & Donald B Rubin, John Wiley and Sons, 2002. p41:

De Caso completo análisis de los confines de la atención a los casos en que todas las variables están presentes. Las ventajas de este enfoque son .... . Desventajas se derivan de la posible pérdida de información en descartar incompleta de los casos. Esta pérdida de información tiene dos aspectos: la pérdida de precisión y sesgo cuando la falta de datos mecanismo no es MCAR, y del total de los casos no son una muestra aleatoria de todos los casos".

De: Sesgo y eficiencia de múltiples imputación en comparación con completa-análisis de casos para falta de valores de la covariable. Ian R. White y John B. Carlin. La estadística en Medicina, Volumen 29, número 28, 2010

En particular, mientras que MI insignificante sesgo y CC está sesgada bajo el MAR mecanismos, existen otros mecanismos en virtud de que CC ha insignificante sesgo y MI es sesgada. Este punto es muy mal entendido, pero tiene importantes implicaciones. http://onlinelibrary.wiley.com/doi/10.1002/sim.3944/pdf

2voto

Jonathan Bartlett Puntos 151

En general, se completa el análisis de casos es parcial cuando los datos no están MCAR. Sin embargo, cuando el análisis consiste en la colocación de un modelo de regresión, se completa el análisis de casos es imparcial en virtud de la débil condición de que missingness es independiente de la variable de resultado, con la condición de que las covariables. Dependiendo de la variable(s) que contienen valores faltantes, esta condición, a veces corresponde a MAR mecanismos, y a veces a MNAR mecanismos.

Por ejemplo, supongamos que el resultado Y es la variable con los valores que faltan. Luego missingness ser independiente de los resultados condicional en las covariables corresponde a la MAR asunción, que dice que la probabilidad de missingness es independiente de la parte variable observada condicional en el plenamente las variables observadas. Alternativamente, supongamos que missingness en una covariable X depende del valor de la covariable, de modo que los datos son MNAR. Siempre missingness en X es independiente de Y condicionada a X y otras covariables en el modelo de análisis, se completa el análisis de casos es imparcial.

Para más información sobre esto, ver:

1) el documento citado en una respuesta anterior por el Blanco y Carlin: Sesgo y eficiencia de múltiples imputación en comparación con completa-análisis de casos de falta de valores de la covariable. Ian R. White y John B. Carlin. La estadística en Medicina, Volumen 29, número 28, 2010

2) un documento por mí mismo y sus colegas publicaron en Bioestadística: http://doi.org/10.1093/biostatistics/kxu023

3) un post en el blog escribí anteriormente sobre este tema aquí: http://thestatsgeek.com/2013/07/06/when-is-complete-case-analysis-unbiased/

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X