Al tener sólo información sobre el rango de sus datos, es difícil sacar conclusiones sobre la media, pero aún es posible. De hecho, incluso es posible hacer algunas conjeturas sobre la media de la población dada una un solo punto de datos . En este tipo de casos, usted tienen para hacer algunas suposiciones sobre la distribución de sus datos. Digamos que usted podría asumir que sus datos provienen de una distribución Normal, con parámetros desconocidos $\mu$ y $\sigma$ . Utilizando Bayesiano podría elegir alguna distribución a priori para esos parámetros, tomar muestras de esas distribuciones, evaluar la probabilidad de sus datos dados esos parámetros, y así, inferir sobre los parámetros. En este caso, podría utilizar Cálculo bayesiano aproximado . Por ejemplo, podría buscar los parámetros de la distribución normal que hacen que el 95% de los valores se ajusten al intervalo de su interés. Buscar la coincidencia exacta parece ser excesivamente estricto en este caso, así que vamos a suponer un cierto margen de error, digamos $\pm$ 2%. A continuación pongo un código R que ilustra el caso.
x <- c(1.1, 2.0) # data
crit <- c(0.025, 0.975) # 95% coverage criteria
# function to simulate a single value
simf <- function(crit) {
mu <- rnorm(1, 1.5, 0.5) # sampling mu
sigma <- runif(1, 0, 2) # sampling sigma
p <- pnorm(x, mu, sigma) # checking coverage
c(accept = all(abs(p - crit) <= 0.02), # acceptance
mu = mu,
sigma = sigma)
}
sim <- t(replicate(n = 1e6, simf(crit))) # simulate
sim_accepted <- sim[sim[,1] == 1, -1] # take only accepted values
t(apply(sim_accepted, 2, function(v) c(mean = mean(v),
sd = sd(v),
quantile(v, c(0.025, 0.975)))))
## mean sd 2.5% 97.5%
## mu 1.5500938 0.03816268 1.4775592 1.6229234
## sigma 0.2173743 0.01868164 0.1843378 0.2537986
mean(x)
## [1] 1.55
library(ggplot2)
ggplot(as.data.frame(sim_accepted), aes(x=mu, y=sigma)) +
geom_point(color = "lightgray") +
geom_density2d() +
geom_vline(xintercept = x, color = "red") +
theme_bw()
Utilizando este enfoque, también podría intentar ajustar diferentes distribuciones (por ejemplo, las no simétricas) o hacer diferentes suposiciones a priori. Como puede ver, el uso de una distribución simétrica, como la Normal, lleva al mismo resultado que si se toma la media aritmética de los puntos, pero no será el caso con las distribuciones no simétricas, ya que Till Hoffmann que ya ha señalado en su respuesta. Se trata básicamente de una forma de pensar similar a la de dsaxton pero utilizando sólo los dos puntos de datos para el intervalo y con el uso de una simulación.