15 votos

¿Por qué ecdf utiliza una función de paso y no una interpolación lineal?

CDF empírica funciones se calcula generalmente por una función de paso. Hay una razón por la que esto se hace de tal manera y no mediante una interpolación lineal? Hace la función de paso tiene cualquier teóricas interesantes propiedades que nos hacen preferir?

Aquí es un ejemplo de los dos:

ecdf2 <- function (x) {
  x <- sort(x)
  n <- length(x)
  if (n < 1) 
    stop("'x' must have 1 or more non-missing values")
  vals <- unique(x)
  rval <- approxfun(vals, cumsum(tabulate(match(x, vals)))/n, 
                    method = "linear", yleft = 0, yright = 1, f = 0, ties = "ordered")
  class(rval) <- c("ecdf", class(rval))
  assign("nobs", n, envir = environment(rval))
  attr(rval, "call") <- sys.call()
  rval
}


set.seed(2016-08-18)
a <- rnorm(10)
a2 <- ecdf(a)
a3 <- ecdf2(a)

par(mfrow = c(1,2))
curve(a2, -2,2, main = "step function ecdf")
curve(a3, -2,2, main = "linear interpolation function ecdf")

enter image description here

22voto

h4sy0u Puntos 39

Es por definición.

Empírica de la función de distribución de un conjunto de observaciones (Xn) está definido por

Fe(t)=#{XnXnt}n

Donde # es el conjunto de cardinalidad. Este es, por naturaleza, una función de paso. Converge a la real CDF casi seguramente.

También tenga en cuenta que para cualquier distribución con P(X=x)0 durante al menos dos x (especialmente degenerada de distribuciones discretas), su variante de ECDF ¿ no convergen a la actual de la CDF. Por ejemplo, considere una distribución de Bernoulli con CDF

FX(x)=pχx0+(1p)χx1 esta es una función de paso mientras que ecdf2 convergerán a χx0(p+(1p)min(x,1)) (un modelo lineal por tramos de la función de conectar (0,p)(1,1).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X