Yo no usaría el punto medio de cualquiera de los intervalos (esperar tal vez como una estimación inicial para algún procedimiento iterativo).
Si los datos fueran realmente de una distribución exponencial, los valores dentro de cada grupo debe ser derecho de sesgo; la media se espera que esté a la izquierda de la media de la papelera de límites.
Tenga en cuenta que la ecuación de $\hat{\lambda}=\frac{1}{\bar{X}}$ es conveniente si usted tiene todos los datos. Con agrupada de los datos que usted necesita para maximizar la probabilidad de que un binned (es decir, intervalo de censura) exponencial.
[La contribución a la log-verosimilitud de la $n_i$ observaciones en el recipiente $i$ -- entre los $l_i$ $u_i$ - es $n_i \log(F(l_i)-F(u_i))$ (donde los dos términos en $F$ son funciones del parámetro(s) de la distribución).]
Debido a la falta de propiedad de la memoria de la exponencial, si usted tiene una buena aproximación de la media de la exponencial también se tiene una buena aproximación de la cantidad por la que la media de la distribución por encima de cierto valor $x_0$ supera $x_0$.
Así (suponiendo que no directamente maximizar la probabilidad de* en el intervalo de datos censurados como ya he sugerido), usted podría comenzar con algunos estimación aproximada de la media ($m^{(0)}$ dicen) y el uso de $120+m^{(0)}$ como un "centro" de la parte superior de la cola.
Esto podría entonces ser utilizado para obtener una mejor estimación de los parámetros (y por tanto de la media) y así obtener una mejor estimación de la media condicional en cada bin, incluyendo la parte superior. [Si quieres un enfoque que tal vez se inclinan por hacer EM directamente.]
Varias simple de las estimaciones de la media puede obtenerse rápidamente. Por ejemplo, ya que el 41% de los valores se producen por debajo de 20, $\exp(-\frac{20}{\hat{\lambda}^{(0)}})=1-0.41$ que corresponde a una estimación de la media de cerca de $38$. Alternativamente, uno puede obtener una rápida globo ocular estimación de la mediana (algo menos de 30, tal vez de unos 28), por lo que la media debe estar en algún lugar cerca de $28/\log(2)$, o alrededor de $40$.
Cualquiera de estos sería razonable para el uso como una estimación inicial a lo lejos por encima de los 120 a cabo una estimación para la media condicional para el último bin.
* Una alternativa para maximizar la probabilidad sería reducir al mínimo el estadístico de chi-cuadrado; el mismo ajuste a d.f. sería utilizado en esa instancia. El estadístico de chi-cuadrado es relativamente fácil de calcular, y bastante simple para optimizar para un único parámetro: