1 votos

Determinar la importancia de un valor observado

Tengo una ECDF de valores que no siguen una distribución determinada (pensaron que eran ligeramente normales, no lo son). Y deseo determinar si un nuevo valor observado es significativo o un valor atípico o no. ¿Cómo puedo hacerlo?

Por ejemplo, tengo la siguiente distribución:

Value         % of Observations
...
-4                   3%
-3                   3.5%
-2                   4%
-1                   6%
0                   12%
1                    5%
2                    5%
3                    4%
4                    1%
...

Con las diferentes distribuciones se fijan unos límites o umbrales determinados para señalar un valor atípico, por ejemplo, 3 $\sigma$ para una distribución normal, pero eso no ayuda a clasificar los valores ordinarios como un $2$ en el caso anterior. Sólo el 5% de los valores observados son $2$ pero sigue siendo bastante común en relación con el resto.

¿Existe alguna forma de cuantificar la "exageración" de un valor? Por ejemplo, si el valor $10$ se observó podría decir que es mayor que $99\%$ de valores que posiblemente lo conviertan en un valor atípico. Sin embargo, esto no funcionará para los valores no atípicos, por ejemplo, el valor $0$ es mayor que $\approx50\%$ de todas las observaciones pero esto no me dice que $0$ es el valor más común.

Nota: No estoy interesado en ajustar una distribución particular ni nada por el estilo. Sólo tengo un gran conjunto de datos para el que se puede evaluar una ECDF y quiero saber si un nuevo valor observado encaja en esta típica o es un valor extremo.

1voto

Zizzencs Puntos 1358

Puedes saber lo extremo que es un nuevo valor comparándolo con la distribución de las formas que ya estás haciendo.

Pero eso no te dice la probabilidad de que provenga de esta distribución. Los datos por sí solos no pueden decírtelo, a menos que tengas una distribución alternativa y sepas que el nuevo valor procede de una u otra.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X