Si tenemos una variable aleatoria$X$ con una variación infinita$Var(X)$, entonces, ¿cómo puede ser útil la expectativa$E(X)$? En el sentido de que nuestros valores varían tanto de ella que no tiene relevancia. Tal vez un ejemplo podría aclarar las cosas?
Respuestas
¿Demasiados anuncios?Tal vez este ejemplo ayudará a aclarar las cosas:
Supongamos que estoy tomando muy caro muestras de dos normales las poblaciones con la misma desconoce la varianza de la población, y quiero prueba si los dos de la población significa que son iguales. Yo sólo puede permitirse el lujo de tomar dos observaciones de cada población. Tal vez estas son las observaciones desde el espacio el cohete lanza o a partir de algunos raros tran-uranic elemento sólo en el átomo devil.
Así que esta va a ser un conjunto de dos muestras de prueba de la t y (bajo la hipótesis nula de igualdad de las poblaciones de los medios) de la t estadística tendrá la t de Student de distribución con $n_1 + n_2 - 2 = 2$ grados de libertad. Esta distribución tiene la expectativa de 0 y el infinito (o inexistente) de la varianza (dependiendo de la definición).
Mi primera muestra da los valores 1 y 2; el segundo da 101 y 102. El conjunto de prueba de la t de procedimiento en R da de salida de la siguiente manera:
t.test(x1, x2, var.eq=2)
Two Sample t-test
data: x1 and x2
t = -141.42, df = 2, p-value = 5e-05
alternative hypothesis: true difference in means is not equal to 0
sample estimates:
mean of x mean of y
1.5 101.5
Por lo que el P-valor es minúsculo. Puedo presumir de que el de la población significa que no son iguales. La t de Student, distribución (con una media y varianza infinita) me ha dado un resultado útil. Aunque la distribución tiene una infinidad de varianza puedo encontrar las probabilidades en la cola de la distribución que son significativas.
Nota: Aunque este es un estándar frecuentista de la prueba de hipótesis, y frecuentista estadísticos disfrutar de creer que no arrastre de antes de la información", en sus inferencias, uno tiene que admitir que esta situación es cargados con la información de' más allá de los datos: (1) La información que la población está normalmente distribuida y (2) la asunción que las dos poblaciones tienen varianzas iguales son ambos superpuestos en la estructura de la prueba antes de ver los datos. Sin embargo, creo que el ejemplo tiene su propio en el que muestra que las distribuciones sin desviaciones puede ser útil en la inferencia estadística.
Algunas propiedades básicas pero útiles de la expectativa se mantienen sin ninguna suposición sobre la varianza. Por ejemplo, si$X$ es una variable aleatoria no negativa, entonces $$ \ Pr [X \ ge t] \ le \ frac {\ mathbb E [X]} {t} $$ es un límite útil en la cola probabilidad de una distribución de cola pesada.