46 votos

¿Definición rigurosa de un valor atípico?

A menudo se habla de cómo tratar los valores atípicos en las estadísticas. Lo que me molesta de esto es que, hasta donde yo sé, la definición de un valor atípico es completamente subjetiva. Por ejemplo, si la verdadera distribución de alguna variable aleatoria tiene muchas colas o es bimodal, cualquier visualización estándar o estadística de resumen para detectar valores atípicos eliminará incorrectamente partes de la distribución de la que se quiere tomar una muestra. ¿Cuál es la definición rigurosa de un valor atípico, si es que existe, y cómo pueden tratarse los valores atípicos sin introducir cantidades irrazonables de subjetividad en un análisis?

0voto

furinkan Puntos 356

Definimos un valor atípico como un miembro del conjunto mínimo de elementos que debe eliminarse de un conjunto de datos de tamaño n para garantizar el cumplimiento del 100% de las pruebas RUM realizadas con un nivel de confianza del 95% en todos los (2^n -1) subconjuntos únicos de los datos. Véase el texto de Karian y Dudewicz sobre el ajuste de datos a pdfs utilizando R (septiembre de 2010) para la definición de la prueba RUM.

-2voto

Los valores atípicos sólo son importantes en el ámbito frecuentista. Si un solo dato añade un sesgo a su modelo, definido por una distribución subyacente predeterminada por su teoría, entonces es un valor atípico para ese modelo. La subjetividad reside en el hecho de que si su teoría plantea un modelo diferente, entonces puede tener un conjunto diferente de puntos como valores atípicos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X