6 votos

Qué $r$ sobreestimar los efectos reales para los pequeños de la muestra el tamaño de los conjuntos de datos?

Supongamos $N$ es relativamente pequeño. ¿El producto-momento de Pearson el coeficiente de correlación generalmente sobreestimar el verdadero efectos?

Esto debe ser algo que es bien conocido en las estadísticas. Me gustaría encontrar una referencia puedo citar. Es que hay alguna?

4voto

AdamSane Puntos 1825

De hecho, el ejemplo de correlación es sesgada, pero no sesgados al alza; es sesgada hacia 0 (esto ha sido conocido durante al menos un siglo).

Por ejemplo, acabo de hacer una pequeña simulación -- en una muestra de 10000 simulaciones de muestras de tamaño 3, donde los pares se generan a partir de una población normal bivariante con $\rho= 0.1$, el promedio de la muestra correlación se $0.0685$.

Soper (1913) [1] vino para arriba con algunas aproximaciones al valor esperado de la muestra correlación cuando el muestreo se realiza a partir de una normal bivariante (incluyendo la aproximación $E[r]\approx \rho(1-\frac{1-\rho^2}{2n})\,$) y Fisher [2] trabajó en el problema e hizo algunas de las matemáticas en detalle (y que continúa en posteriores artículos).

[1] Soper, H. E. (1913),
"En el error probable del coeficiente de correlación para una segunda aproximación",
Biometrika, vol 9, p91-115
pdf

[2] Fisher, R. A. (1915),
"Distribución de frecuencias de los valores del coeficiente de correlación en las muestras de un indefinidamente grande de la población",
Biometrika, vol 10, no. 4, 507-521
pdf

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X