He estado leyendo sobre la distancia de cook para identificar valores atípicos que tienen gran influencia en mi forma de regresión. En Cook original del estudio dice que un cut-off de la tasa de 1 deben ser comparables a identificar a los influenciadores. Sin embargo, varios otros estudios de uso 4/n o 4/(n-k-1) como punto de corte.
En mi estudio, ninguno de mis residuos tienen un D mayor que 1. Sin embargo, si yo uso 4/n, así como con una frecuencia de corte (4/149= .026), entonces hay varios puntos de datos que se consideran influyentes. Me decidí a probar si la eliminación de estos puntos de datos haría una diferencia a mi general de regresión lineal. Todos mis IVs conserva su significado y ningún cambio obvio era evidente.
Mi pregunta es, debo retener a todos mis puntos de datos y el uso de la cut-off tasa de 1? O eliminarlos?