4 votos

¿Hay alguna ventaja en ajustar una distribución a los datos para calcular el percentil?

Método 1: El cálculo de los percentiles, por ejemplo, el percentil 99 de los datos, es sencillo y se basa en la ordenación de los valores de los datos.

Método 2: Una forma más complicada de calcular los percentiles será primero ajustar una distribución a los datos (por ejemplo, si sabemos que los datos son normales, ajustamos una distribución normal, o hacemos una estimación de densidad Kernel no paramétrica), y luego calculamos la cdf inversa para obtener el percentil 99 de los datos.

Me pregunto si este último método tiene alguna ventaja. Mis dos suposiciones

  • Estoy pensando que inferir los percentiles a partir de la distribución puede ser más robusto ya que el resultado del método 1 es más sensible a los cambios en los datos?
  • ¿Podemos tratar el resultado del método dos también como una probabilidad de que se produzca el valor, mientras que con el método 1 no podemos?

3voto

kjetil b halvorsen Puntos 7012

Ajustar primero una distribución a los datos (y luego obtener los cuantiles a partir de la distribución ajustada) es una forma de alisado o regularización . Si está razonablemente seguro de que su modelo es razonable, normalmente obtendrá mejores estimaciones. Especialmente si se necesitan estimaciones en la cola.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X