2 votos

Cómo aplicar la eliminación por pares de los valores perdidos

Este método siempre se explica con el borrado de la lista que es muy fácil de entender. Pero no puedo entender pairwise. Google no ayudó ya que en todas partes sólo hay una definición de la misma.

Por favor, explique esto tomando cualquier ejemplo de juguete.

2voto

Zizzencs Puntos 1358

El borrado por lista elimina los casos en los que falta alguna variable.

La eliminación por pares sólo elimina los casos en los que falta una de las variables del modelo concreto que se está evaluando.

Una forma de comparar es con una matriz de correlación de un conjunto de variables que tienen diferentes patrones de falta. Con la eliminación por listas, N será el mismo para cada correlación - será el número de casos completos. Con la eliminación por pares, N variará. Será el número de casos en los que ambas variables de la correlación están presentes (pero pueden faltar otras variables).

1voto

NiallJG Puntos 13

Un ejemplo de juguete es suponer que se tiene un conjunto de datos que contiene estas variables: sexo, edad, educación, ingresos y afiliación política. En cada caso del conjunto de datos, es más probable que falten los valores de algunas de las variables que de otras, dependiendo de la sensibilidad del encuestado a las preguntas de la encuesta.

Digamos que le interesa saber si existe una correlación entre la edad y la afiliación política. Utilizando el método de eliminación de la lista, se eliminan del análisis todos los casos con valores perdidos en una o más variables, aunque el valor perdido diga, ingresos o educación, que no es necesario en su cálculo de la correlación entre la edad y la afiliación política. La eliminación de los casos incompletos puede producir una reducción drástica del tamaño total de la muestra.

El borrado por parejas es una alternativa al borrado por listas para mitigar la pérdida de datos. Al utilizar la eliminación por pares, cualquier caso puede contribuir a algunos análisis pero no a otros, dependiendo de si los datos necesarios están disponibles. Por lo tanto, para su análisis en este ejemplo, todos los casos con datos disponibles sobre la edad y la afiliación política se incluirán independientemente de los valores que falten para otras variables como el sexo, los ingresos o la educación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X