Cálculo del valor medio sin tener en cuenta los valores atípicos

Question

Cálculo del valor medio sin tener en cuenta los valores atípicos

Preguntado el 16 de Mayo, 2011: Cuando se hizo la pregunta
2412 visitas: Cuantas visitas ha tenido la pregunta
5 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Esto es más bien una pregunta de estadística general, aunque si importa estoy escribiendo código PHP.

Supongamos que intento calcular el valor medio de un juguete que suele comprarse y venderse en el mercado secundario, y tengo un conjunto de valores de precios extraídos tanto de las subastas como de los datos de "precio pagado" introducidos por el usuario. Los puntos de datos que representan subastas son bastante fiables, pero también obtengo algún punto de datos del tipo "venta de garaje", donde alguien puede haber pagado un dólar para comprar algo a la tía Polly en una venta de garaje. El problema es que el $1 El tipo de puntos de datos no son realmente valiosos para mí, ya que no indican realmente el valor - la tía Polly no sabía nada mejor, y no le importaba. Del mismo modo, de vez en cuando puedo obtener un punto de datos procedentes de un bromista que entra $9000 por un juguete que en realidad sólo vale $9 .

Así que, a la hora de calcular el valor, ¿cuál es la mejor manera de eliminar este tipo de anomalías de unos datos que, por lo demás, son útiles?

He leído sobre los valores atípicos, y algo sobre ignorar generalmente cualquier cosa que esté más de 2,5 desviaciones estándar fuera del resto de los datos, pero estoy buscando la receta completa, aquí.

¡Muchas gracias!

Preguntado el 16 de Mayo, 2011 por Max

Answer 1

5 Respuestas

Answer 2

11voto

BQ. Puntos 3975

Sí, porque si Z tiene un dual, entonces en particular Z ⊗ - tiene un adjunto izquierdo (Z * ⊗ -) y, por tanto, conmuta con los límites (y de forma similar con los colímites, pero eso es automático si la categoría es monoidal cerrada).

Respondido el 16 de Mayo, 2011 por BQ. (3975 Puntos )

Answer 3

5voto

Valentin Rocher Puntos 121

Podría considerar el uso de un media recortada . Esto implicaría descartar, por ejemplo, el 10% de los valores más altos y el 10% de los valores más bajos, independientemente de que los considere malos.

Respondido el 16 de Mayo, 2011 por Valentin Rocher (121 Puntos )

Answer 4

3voto

pkaeding Puntos 12935

si quieres una solución eficiente, usar un Buck Converter sería una opción inteligente. puedes construirlo con componentes discretos (inductor, diodo, condensador y transistor) o puedes usar algún IC.

http://en.wikipedia.org/wiki/Buck_converter

Respondido el 16 de Mayo, 2011 por pkaeding (12935 Puntos )

Answer 5

0voto

sabre23t Puntos 199

Quizás un estimador robusto como RANSAC podría utilizarse aquí.

Respondido el 16 de Mayo, 2011 por sabre23t (199 Puntos )

Answer 6

-1voto

Owen Fraser-Green Puntos 642

Espero que esto ayude

Los enfoques simplistas, como los sugeridos aquí, suelen fallar por su falta de generalidad. En general, se puede tener una serie que tenga múltiples tendencias y/o múltiples niveles, por lo que para detectar anomalías hay que "controlar" estos efectos. Además, puede haber un efecto estacional que puede haber comenzado en los últimos k períodos y no estar presente en los primeros n-k valores. Ahora vayamos al meollo del problema. Supongamos que no hay desplazamientos de la media/sin cambios de tendencia/sin estructura de pulso estacional en los datos. Los datos pueden estar autocorrelacionados, lo que hace que la desviación típica simple esté sobreestimada o infraestimada, dependiendo de la naturaleza de la autocorrelación. La posible existencia de pulsos, pulsos estacionales, cambios de nivel y/o tendencias temporales locales ofusca la identificación de las "excepciones". El uso de una "mala desviación estándar" para tratar de identificar las anomalías es defectuoso porque es una prueba fuera del modelo en comparación con una "prueba dentro del modelo" que, en última instancia, es lo que se utiliza para concluir sobre la importancia estadística de las anomilías. Puede buscar en Google "cómo hacer la detección de intervención estadística" para ayudarle a encontrar fuentes/software para hacer esto.

Respondido el 16 de Mayo, 2011 por Owen Fraser-Green (642 Puntos )

Cálculo del valor medio sin tener en cuenta los valores atípicos

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Cálculo del valor medio sin tener en cuenta los valores atípicos

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: