5 votos

Cómo saber la extrema un valor atípico es?

Yo soy el análisis de algunos datos y el deseo de mirar un punto en particular y ver cómo "extrema".

Puedo excluir este atípico de los datos, calcular el conjunto de datos de la desviación estándar y la media, a continuación, compare mi atípico para QUE, o no me calcular la desviación estándar y la media, CON el outlier incluido y, a CONTINUACIÓN, analizar el valor atípico con respecto a las métricas?

4voto

Patrick Puntos 183

En realidad, ninguno: calcular cómo ese punto es de extrema con respecto a un estimador robusto de la ubicación de $l_x$ el uso de un estimador robusto de la escala de la $s_x$. En esencia, si su punto original era diferente de los demás, usted será esencialmente haciendo caso omiso de que en el cálculo de $(l_x,s_x)$. si su punto original no era diferente de los demás, va a tener una influencia insignificante en $(l_x,s_x)$. Aquí está un artículo que te ayudará a pensar con claridad acerca de este problema.

3voto

Eero Puntos 1612

Antes de llegar demasiado cómodo con la eliminación de los "valores atípicos" usted puede ser que desee mirar a la outliers conjunto de datos en el TeachingDemos paquete de R y de trabajo a través de los ejemplos en la página de ayuda.

Sería bueno buscar a través de más discusión sobre el tema, un lugar para comenzar es la wikipedia. También incluye algunos de los otros métodos de mirar a los valores atípicos.

Piense también en lo de la munición que le estás dando a los críticos de sus resultados si usted eliminar los valores extremos.

0voto

Owen Fraser-Green Puntos 642

He aquí algunos consejos disponibles en la web : de la http://www.autobox.com/cms/index.php/blog , un sitio de software que se centra en este tema. Estoy involucrado en el desarrollo de software para este sitio.

¿Por qué no simple outlier métodos de trabajo? El argumento en contra de nuestra competencia.

Para un par de razones:

No era un valor atípico. Fue una temporada de pulso.

Las observaciones fuera de los 2 o 3 sigma límites de hecho podría ser un recién formado un patrón estacional. Por ejemplo, a mitad de camino a través de la serie de tiempo de junio ha convertido en llegar a ser muy alto cuando se había promedio. Métodos sencillos acaba de quitar cualquier cosa fuera de los límites que podría ser tirar el bebé con el agua del baño".

3 sigma cálculo fue sesgada debido a el valor atípico en sí.

Es un dilema del huevo y la gallina. Los valores atípicos hacer el sigma de ancho, así que olvida los valores atípicos.

El outlier era en realidad una promoción.

Utilizando sólo la historia de la serie no es suficiente. Usted debe incluir causals ya que pueden ayudar a explicar lo que es percibido como un valor atípico.

Ahora vamos a considerar el inlier.

No podía ser de valores atípicos que están dentro de 3 sigma y digamos que la observación es cerca de la media. Cuando podía la media de una inusual? Cuando la observación de que debería haber sido de alta y no por alguna razón.

Los métodos simples de la fuerza que el usuario especifique el número de veces que el sistema debe recorrer para eliminar los valores extremos.

Luego se preguntó cuántas veces usted quiere recorrer para encontrar las intervenciones de la herramienta de previsión? Es esta inteligencia o una muleta? Así que, de alguna manera están pensados para proporcionar algunos empíricamente basada en la orientación??? No sé como sería sólo una conjetura.

La realidad es que los métodos Simples/uso de software de un proceso donde ellos asumen un "modelo de promedio" para determinar los valores extremos. La forma correcta es la construcción de un modelo e identificar los valores atípicos en el mismo tiempo. Suena simple, ¿verdad?

¿Alguien tiene otros ejemplos de mala outlier metodologías? o cualquier otro software con sus ejemplos publicado?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X