33 votos

¿Cuándo, si acaso, una estadística mediana es suficiente?

Me encontré con un comentario casual en El estadístico químico que la mediana de la muestra podría ser a menudo una opción para un estadístico suficiente pero, además del caso obvio de una o dos observaciones en las que es igual a la media de la muestra, no puedo pensar en otro caso no trivial e iid en el que la mediana de la muestra sea suficiente.

1 votos

¿Querías escribir "que una muestra de la mediana puede ser a menudo"?

10 votos

Es una pregunta interesante; la doble exponencial tiene la mediana para un estimador ML de su parámetro de localización, pero no es suficiente.

1 votos

Sinceramente, me parece que falta algo en esta pregunta, ¿cómo es posible que un estimador ML no sea suficiente por sí mismo? perdón por lanzar mis dudas de esta manera, nunca me interesó mucho la estadística suficiente.

25voto

Lev Puntos 2212

En el caso de que el soporte de la distribución no dependa del parámetro desconocido θ, podemos invocar la (Fréchet-Darmois-)Pitman-Koopman teorema, es decir, que la densidad de las observaciones es necesariamente de la forma de la familia exponencial, $$ \exp\{ \theta T(x) - \psi(\theta) \}h(x) $$ para concluir que, dado que la estadística natural suficiente $$ S=\sum_{i=1}^n T(x_i) $$ es también mínimo suficiente, entonces la mediana debe ser una función de $S$ y también al revés, lo que es imposible: modificar un extremo en las observaciones $x_1,\ldots,x_n$ , $n>2$ , modifica $S$ pero no modifica la mediana. Por lo tanto, la mediana no puede ser suficiente cuando $n>2$ .

En el caso alternativo en que el soporte de la distribución sí depende del parámetro desconocido $θ$ No estoy tan satisfecho con la siguiente prueba: en primer lugar, podemos considerar el caso simple cuando $$ f(x|\theta) = h(x) \mathbb{I}_{A_\theta}(x) \tau(\theta) $$ donde el conjunto $A_\theta$ indexado por $θ$ denota el soporte de $f(\cdot|\theta)$ . En ese caso, suponiendo que la mediana es suficiente, el teorema de la factorización implica que tenemos que $$ \prod_{i=1}^n \mathbb{I}_{A_\theta}(x_i) $$ es un binario ( $0-1$ ) de la mediana de la muestra $$ \prod_{i=1}^n \mathbb{I}_{A_\theta}(x_i) = \mathbb{I}_{B^n_\theta}(\text{med}(x_{1:n})) $$ De hecho, no hay ningún término extra en la factorización ya que también debería ser (i) una función binaria de los datos y (ii) independiente de $\theta$ . Añadiendo una observación más $x_{n+1}$ cuyo valor es tal que no modifica la mediana de la muestra conduce entonces a una contradicción ya que puede estar dentro o fuera del conjunto de soporte, mientras que $$ \mathbb{I}_{B^{n+1}_\theta}(\text{med}(x_{1:n+1}))=\mathbb{I}_{B^n_\theta}(\text{med}(x_{1:n}))\times \mathbb{I}_{A_\theta}(x_{n+1}) $$

1 votos

Qué es lo que se establece $B_\theta^n$ ?

4 votos

¿No es suficiente la mediana de Laplace cuando se conoce la escala?

2 votos

No, no lo es. Porque Laplace no está dentro de las familias exponenciales.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X