48 votos

¿Por qué no el denominador de la estimador de la covarianza n-2 en lugar de n-1?

El denominador de la (imparcial) de la varianza del estimador es n1n1 hay nn observaciones y sólo un parámetro que se está estimando.

V(X)=ni=1(Xi¯X)2n1

Por la misma razón me pregunto por qué no debería el denominador de la covarianza ser n2 cuando dos parámetros se calculan?

Cov(X,Y)=ni=1(Xi¯X)(Yi¯Y)n1

Cualquier ayuda será muy apreciada. Gracias

41voto

jldugger Puntos 7490

Las covarianzas son desviaciones.

Ya por la polarización de la identidad

Cov(X,Y)=14(Var(X+Y)Var(XY))),

el denominador debe ser el mismo.

23voto

Silverfish Puntos 6909

Un caso especial que debe darte una intuición; pensar acerca de lo siguiente:

^Cov(X,X)=ˆV(X)

Usted está feliz de que el último es ni=1(Xi¯X)2n1, debido a la corrección de Bessel.

Pero la sustitución de YXen\hat{\mathbb{Cov}}\left(X, Y\right)paralaexda\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(X_{i}-\overline{X}\right)}{\text{misterio denominador}}$, entonces, ¿qué hacer ahora creo que sería la mejor forma de llenar el espacio en blanco?

10voto

user8076 Puntos 16

Rápido y sucio respuesta... Vamos a considerar en primer lugar var(X); si usted tenía n observaciones conocidos con el valor esperado de E(X)=0 utilizaría 1nni=1X2i para la estimación de la varianza.

El valor esperado de ser desconocido, usted puede transformar su n observaciones en n1 observaciones con el conocido valor esperado tomando Ai=XiX1 por i=2,, n. Usted recibirá una fórmula con un n1 en el denominador, sin embargo, el Ai no son independientes y que tendría que tomar esto en cuenta; al final se iba a encontrar la fórmula habitual.

Ahora para la covarianza puede utilizar la misma idea: si el valor esperado de (X,Y) era (0,0), que había tenido un 1n en la fórmula. Restando (X1,Y1) a todos los demás valores observados, se obtiene n1 observaciones con el conocido valor esperado... y un 1n1 en la fórmula - una vez más, este presenta algunos dependencia a tomar en cuenta.

P. S. La manera correcta de hacerlo es elegir un ortonormales base de (1,,1)\asesino, que es de n1 vectores de c1,,cn1Rn que

  • jc2ij=1 para todo i,
  • jcij=0 para todo i,
  • jci1jci2j=0 para todo i1i2.

A continuación, puede definir n1 variables Ai=jcijXj y Bi=jcijYj. El (Ai,Bi) son independientes, tienen el valor esperado de (0,0), y tienen la misma varianza/covarianza de las variables originales.

Todo el punto es que si usted quiere deshacerse de lo desconocido a la expectativa, se le cae una (y sólo una) de observación. Esto funciona de la misma para ambos casos.

9voto

BatchyX Puntos 812

Supongo que una manera de construir la intuición detrás de la utilización de 'n-1' y no 'n-2' es - que para el cálculo de co-varianza no necesitamos de la media de X y Y, pero cualquiera de los dos, es decir,

8voto

statchrist Puntos 187

Aquí es una prueba de que el p-variable muestra el estimador de la covarianza con denominador 1n1 es un imparcial estimador de la matriz de covarianza:

x=(x1,...,xp).

Σ=E((xμ)(xμ))

S=1n(xiˉx)(xiˉx)

Para mostrar: E(S)=n1nΣ

Prueba: S=1nxixiˉxˉx

Siguiente:

(1) E(xixi)=Σ+μμ

(2) E(ˉxˉx)=1nΣ+μμ

Por lo tanto: E(S)=Σ+μμ(1nΣ+μμ)=n1nΣ

Y por lo que Su=nn1 S, con el final denominador 1n1, es imparcial. Los elementos de la diagonal de Su son sus covarianzas de la muestra.

Observaciones adicionales:

  1. El n sorteos son independientes. Este se utiliza en (2) para calcular la covarianza de la media de la muestra.

  2. El paso (1) y (2) utilice el hecho de que Cov(x)=E[xx]μμ

  3. El paso (2) utiliza el hecho de que Cov(ˉx)=1nΣ

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X