21 votos

Fallas en Frecuentista de Inferencia

Tengo problema para entender el ejemplo siguiente.

Computer Age Statistical Inference, by Bradley Efron and Trevor Hastie, Page 31

(1) Después de que el día siguiente de que el fallo descubierto lo que puede decir acerca de la observación? $X_i\nsim N(\mu,1)$ o sólo $X_i\sim N(\mu_2,1)$. Algunos de observación son de $N(\mu,1)$ , y otros no. ¿Qué podemos decir acerca de todas observación. Estoy mal algo? ¿Por qué no usar Trunca normal?

(2) ¿Qué hizo exactamente la inferencia bayesiana en esta situación? Creo que ,teniendo en $\mu$ aleatorios como variable de control (modelo) el glitch, pero teniendo en cuenta $X\sim N(\mu , 1)$ que estoy dudando a aceptar esto.

(3) En absoluto, es la conversación "3.3) Defectos en frecuentista de inferencia" válido? Es esto justo? y con exageración ?

fuente:Equipo de la Edad de la Inferencia Estadística, por Bradley Efron y Trevor Hastie, Página 31.

34voto

Aaron Puntos 36

Soy un Bayesiano, pero me parece que estos tipos de críticas contra el "frequentists" a ser exagerado e injusto. Ambos Bayesians y estadísticos clásicas aceptar todos el mismo los resultados matemáticos para ser verdad, así que realmente no hay ninguna disputa acerca de las propiedades de los distintos estimadores. Incluso si usted es un Bayesiano, es claramente cierto que la media de la muestra no es un estimador imparcial (el concepto de "sesgo" ser una de las que las condiciones en el parámetro desconocido). Así, en primer lugar, la frecuentista es correcto que la media de la muestra no es un estimador imparcial (y cualquier sensato Bayesiano tendría que estar de acuerdo con esto, habida cuenta de la supuesta distribuciones). En segundo lugar, si un frecuentista en realidad encontró con esta situación, que es casi seguro que la actualización de su estimador para reflejar el mecanismo de censura en los datos.

Es completamente posible que las frecuentista el uso de un estimador que es imparcial, y que se reduzca a la media de la muestra en el caso especial donde no hay datos censurados. De hecho, la mayoría de los estándar frecuencial de los estimadores de esta propiedad. Así, aunque la media de la muestra es de hecho un estimador sesgado en este caso, el frecuentista podría utilizar una alternativa estimador que es imparcial, y que pasa a dar el mismo estimado como la media de la muestra para este tipo de datos. Por lo tanto, como un asunto práctico, el frecuentista puede felizmente aceptar la estimación de la media de la muestra es la estimación correcta de los datos. En otras palabras, no hay absolutamente ninguna razón por la que el Bayesiano debe "venir al rescate" --- el frecuentista será capaz de albergar la información que ha cambiado de manera perfectamente adecuada.


Más detalles: Supongamos que usted ha $m$ no censurado de datos de puntos de $x_1,...,x_m$ e $n-m$ censurado puntos de datos, que son conocidos por estar en algún lugar por encima de la cut-off $\mu_* = 100$. Dada la distribución normal subyacente para la pre-censurado valores de los datos, la función de verosimilitud logarítmica de los datos es:

$$\ell_\mathbb{x}(\mu) = \sum_{i=1}^m \ln \phi (x_i-\mu) + (n-m) \ln (1 - \Phi(\mu_*-\mu)).$$

Desde $\ln \phi (x_i-\mu) = - \tfrac{1}{2}(x_i-\mu)^2+\text{const}$, diferenciando da la puntuación de la función:

$$\frac{d \ell_\mathbb{x}}{d \mu}(\mu) = m (\bar{x}_m - \mu) + (n-m) \cdot \frac{\phi(\mu_*-\mu)}{1 - \Phi(\mu_*-\mu)}.$$

así que el MLE es el valor de $\hat{\mu}$ que resuelve:

$$\bar{x}_m = \hat{\mu} + \frac{n-m}{m} \cdot \frac{\phi(\mu_*-\hat{\mu})}{1 - \Phi(\mu_*-\hat{\mu})}.$$

El MLE en general será un estimador sesgado, pero debe haber otros razonable frecuentista propiedades, y por lo que probablemente sería considerado un estimador razonable en este caso. (Incluso si la frecuentista es que buscan una mejoría, como un "sesgo corregido" versión a escala de la MLE, es probable que sea un otro estimador es asintóticamente equivalente a la MLE.) En el caso en que no hay datos censurados tenemos $m=n$, por lo que el MLE se reduce a $\hat{\mu} = \bar{x}_m$. Así que en este caso, si el frecuentista utiliza el MLE, que llegará a la misma estimación para los no-censurado datos como si fueran el uso de la media de la muestra. (Tenga en cuenta que hay una diferencia entre un estimador (que es una función) y una estimación (que es sólo uno o algunos de los valores de salida a partir de esa función).

14voto

Cliff AB Puntos 3213

Vale la pena señalar que no hay nada que impida Frecuentista análisis de decir

"Condicional en ninguno de sus datos para ser censurado, $\hat \mu$ es igual a $\bar x$ y será imparcial. Condicional en algunos de sus datos para ser censurado, el MLE estimador $\hat \mu$ ya no es igual a $\bar x$ y tiene un cierto sesgo".

Por supuesto, dejando de lado a las más de si hay datos censurados significa que todo este marco tiene sesgo, pero no hay nada que impida Frequentists de hacer declaraciones condicionales.

9voto

blank blankman Puntos 71

Creo que esto es exagerado idioma. Frecuentista y Bayesiana tienen sus méritos, y los estadísticos de forma rutinaria se basan en dos tipos en su trabajo. Para responder a tus preguntas:

  1. Todavía podemos considerar $X \sim N(\mu, 1)$. Sin embargo, no estamos observando $X$, pero $X' = \min(100, X)$, que es otra Variable Aleatoria.

2,3. Ahora, los autores están diciendo $\mathbb{E}(X') \neq \mu$, incluso a pesar de $\mathbb{E}(X) = \mu$. Es esta una limitación en frecuentista de inferencia? Tal vez. Muchas técnicas de inferencia estadística (por ejemplo, intervalos de confianza, p-valor de la prueba de hipótesis) requieren que nuestro estimador de ($\hat{\mu}$) a ser una constante (a grandes rasgos: asintóticamente insesgados) estimación de $\mu$. Ahora, la cosa acerca de la inferencia Bayesiana es que no le importa (y mucho) sobre biasedness. No resuelve el frecuentista problema. Solo proporciona otra perspectiva.

El ejemplo dado, sin embargo, es especialmente construidos para ser paradójico. Ya sabemos que no hay valores de $x_i > 100$ se observó, la media observada $\bar{x}'=\sum_i x'_i/n$, es una estimación insesgada de $\mu$. Pero esto es sólo debido a una idiosincrasia de este tipo de configuración, ya que en este caso particular, $\bar{x}'=\sum_i x'_i/n = \sum_i x_i/n = \bar{x}$. Sin embargo, en general, $\mathbb{E}(\bar{x}') \neq \mu$, incluso a pesar de $\mathbb{E}(\bar{x}) = \mu$.

Un Bayesiano, sin embargo, puede ser más flexible. En primer lugar, ella puede definir $S$ a ser el caso de que "una al azar de la muestra no contiene $x'_i=100$". Entonces ella puede decir, $\mathbb{E}(\bar{x}' | S) = \mathbb{E}(\bar{x}|S) = \mu$. Tenga en cuenta que la indicación precisa es bastante delicada. Si la muestra se hizo en el hecho de contener una $x'_i = 100$, pero estamos excluyendo la posibilidad de que la observación, o si estamos repitiendo el procedimiento de muestreo, y sólo la selección de uno que no contenga $x'_i=100$, este no es el evento especificado por $S$.

Esta es, de alguna manera, la limitación de frequentism. Acondicionado en un evento como $S$ simplemente no encaja con frecuentista de la filosofía, ya que está relacionada con el largo plazo el comportamiento de un procedimiento o estimador.

Por otro lado, el hecho de que en este caso particular, el Bayesiano tiene una estimación insesgada es algo de un golpe de suerte. Bayesianism no en el fin de resolver las preguntas frecuentista de inferencia intenta abordar.

$S$Edit $x_i < 100$

Me di cuenta de que en realidad me deje engañar por la paradoja. El uso de un evento como $i$ no soluciona el problema, ya que todavía implica $\mathbb{E}(X')$ para todos los observó $\mathbb{E}(\mu|X'=x')$. En última instancia, creo que la respuesta es que el Bayesiano simplemente no está interesado en %#%#%, y el frecuentista no puede considerar %#%#%. Así, el hecho de que la estimación es parcial o no es irrelevante para el Bayesiano. Un Bayesiano puede, por supuesto, todavía estar interesado en el análisis de las propiedades de un estimador, pero que luego va a hacer de él un frecuentista.

7voto

Jeff Bauer Puntos 236

Es un poco triste ver impreso tal descuido, de la prosa escrita.

Considere la frase

"Para cualquier antes de la densidad de $g(\mu)$, la parte posterior de la densidad de $g(\mu\mid x)= g(\mu)f_{\mu}(x)/f(x)$ ....sólo depende de los datos de la realidad observado..."

-mientras que la fórmula matemática en la anterior frase que muestra que la parte posterior de la densidad depende de los datos y en la previa de la densidad (y no vamos a discutir cómo hacemos para determinar el $f_{\mu}(x)$ e $f(x)$).

En segundo lugar, tenemos aquí una posterior salida de información de la muestra: hemos descubierto que la muestra es censurado. Bayesians han defendido la formal y transparente de la inclusión de la muestra la información en nuestros procedimientos de estimación, por lo que este ejemplo se han utilizado para mostrar cómo se podría incorporar al descubierto ejemplo de censura en la estimación.

Por el contrario, el paso casi nos aconseja ignorar esta información, ya que se elige para terminar con el ejemplo de un plano previo. que podemos aprender, daría posterior expectativa $92$... Pero sería un grave error lo uso porque, Bayesiano, frecuentista o lo que sea, es siempre un grave error ignorar los hechos. Pero el pasaje termina casi maravillarse y de celebración, que obtendríamos $92$,

independientemente de si o no el fallo habría afectado a las lecturas por encima de 100.

La respuesta correcta es $42$, por el camino.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X