En esta pregunta, me gustaría preguntar dos cosas:
- detección de valores atípicos
- prueba de normalidad
Los detalles son los siguientes:
Necesito detectar y eliminar valores atípicos en mis datos. Antes de hacerlo, quiero comprobar si mis datos se distribuyen normalmente o no. Tengo dos variables X(independiente) e Y(dependiente) y 951 registros para ambas.
Quiero saber si, al comprobar la normalidad, tengo que considerar las dos variables simultáneamente o las dos variables de una en una. (En algún lugar, he leído que sólo la variable dependiente se considera para probar la normalidad).
Las figuras adjuntas muestran los resultados de la prueba de normalidad (Análisis>>Descriptivo >>Explorar) de la variable dependiente. Si la prueba de normalidad se realiza sólo en la variable dependiente, entonces muestra que los datos están muy sesgados. En tal caso, ¿cómo puedo eliminar los valores atípicos?
El nivel de significación de las pruebas de Shapiro-Wilk y Kolmogorov-Smirnov es 0,00. La asimetría tiene un estadístico de 22,909 con un SE de 0,079.