4 votos

¿Por qué es el coeficiente de correlación paramétrico?

Estoy un poco confundido en cuanto a la definición de "paramétrico". El libro que estoy leyendo, escribe que "el coeficiente de correlación de intentos para estimar un parámetro determinado en el modelo Normal de dos variables cuantitativas." Estoy un poco confundido en cuanto a cuál de los parámetros en el modelo Normal" y por qué, por ejemplo, rho de Spearman no está vinculado a un parámetro específico. He buscado en Google de todo y todavía no ha encontrado una buena respuesta. La respuesta aquí por Qué es paramétrica de Pearson y de Spearman no paramétrico de la no respuesta al por qué de Pearson coeficiente es necesariamente paramétricas.

5voto

AdamSane Puntos 1825

El coeficiente de correlación de Pearson sí mismo no es ni paramétrico ni no paramétricos.

(Ni son medios, varianzas, etc, o para el caso, son las medianas, ya sea paramétrica o no paramétrica.)

Muchos libros básicos son bastante engañosa en cuanto a la cuestión de qué paramétricos y no paramétricos significa y cómo se importa.

El término paramétrico en el corazón se refiere a una situación donde usted tiene una distribución que es definido hasta un fijo, número finito de parámetros. (Algunos parámetros pueden no ser libres bajo esta formulación; por ejemplo, se podría establecer a cero o estar limitada a la igualdad de una función de otros parámetros, dependiendo de la situación y la parametrización en la mano)

No paramétrica, es lo que tiene cuando la distribución puede depender de una serie de parámetros que no son fijos y, potencialmente, pueden crecer sin límite (en ocasiones llamado 'infinito-paramétrico', aunque no es un requisito que el número de parámetros que jamás podría ser infinito). Es posible que a menudo se refieren a situaciones que hacen algunas suposiciones acerca de la distribución de la forma (por ejemplo, la simetría), pero no aquellas que producen una explícita paramétrico de la forma de la distribución de la población a partir de la cual la muestra fue tomada.

[La terminología acuñada por Jacob Wolfowitz en la década de 1940; sus definiciones fueron bastante similares a estos.]

Hay alguna variación en el uso apropiado de los términos, pero mi descripción se aplica a la mayoría de los usos convencionales (incluyendo los métodos de regresión no paramétrica, donde la distribución condicional de la respuesta puede requerir un no"fija y finita" número de parámetros que la describen - generalmente a través de su media).

En una distribución bivariante, la correlación de Pearson es un parámetro de población -, pero no hay ningún requisito de que el resto de los parámetros se fija o finito, ni siquiera que la correlación de Pearson definir la estructura de la dependencia.

Así, en relación a la correlación de Pearson, donde 'paramétrico'?

Se trata en cuando tratando de construir intervalos de confianza y pruebas.

Si usted asume normalidad bivariada*, entonces la correlación de Pearson es uno de los fijos, número finito de parámetros que definen que bivariante normal; por otra parte las propiedades de correlación de Pearson no dependen de otros parámetros (fuera de algunos de borde de los casos). Así, por ejemplo, cuando la población de correlación de Pearson es $0$ puede escribir la distribución de la muestra de correlación (y por lo tanto, la construcción de una prueba de hipótesis para la correlación) en virtud de que bivariante-normalidad de la asunción.

Específicamente en el bivariado normal, la densidad puede ser escrita en esta forma (para evitar la notación matricial, aunque en mi mente que es un poco más sencillo):

$f(x,y)={\frac {1}{2\pi \sigma _{X}\sigma _{Y}{\sqrt {1-\rho ^{2}}}}}\exp \left(-{\frac {1}{2(1-\rho ^{2})}}\left[{\frac {(x-\mu _{X})^{2}}{\sigma _{X}^{2}}}+{\frac {(y-\mu _{Y})^{2}}{\sigma _{Y}^{2}}}-{\frac {2\rho (x-\mu _{X})(y-\mu _{Y})}{\sigma _{X}\sigma _{Y}}}\right]\right)$

Los parámetros en que la formulación se $\mu_X,\mu_Y,\sigma_X,\sigma_Y$ e $\rho$. La población de correlación de Pearson es $\rho$. Junto a ellos se especifica completamente la distribución de $(X,Y)$.

No es la correlación de sí mismo que es paramétrico (aunque es un parámetro de población); se trata de los supuestos adicionales que se pusieron en marcha, a fin de obtener una distribución de la prueba estadística de la hipótesis nula de que son "paramétrico".

Es que no es necesario para hacer de esta hipótesis en particular a una prueba de correlación de Pearson. Por ejemplo:

  • Usted puede hacer diferentes paramétrico de la asunción, y en algunos casos identificar las diferencias en la distribución de la correlación de Pearson bajo $H_0$, ya sea en forma algebraica, a través de la simulación, o por asintótica (u otros) la aproximación.

  • Usted podría hacer que no paramétrico de la suposición de lo que sea y en su lugar construir un test no paramétrico de la prueba (por ejemplo, prueba de permutación o un arranque de prueba).

*(o normalidad multivariante de manera más general, con $p \choose 2$ de correlación de los parámetros en todos, a lo largo de con $p$ medios y $p$ variaciones)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X