1 votos

Notación del residuo de Pearson frente al coeficiente de correlación de Pearson

De mi libro, el Residuo de Pearson se define como:

$R = \frac{Observed - Expected}{\sqrt{Expected}}$

Y de la wikipedia, el Coeficiente de correlación de Pearson se define como:

$r_{xy}={\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})(y_{i}-{\bar {y}})}{{\sqrt {\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}}{\sqrt {\sum _{i=1}^{n}(y_{i}-{\bar {y}})^{2}}}}}$

Entonces, ¿se trata de dos medidas completamente distintas y sin relación entre sí que casualmente utilizan la R minúscula y la R mayúscula?


Una de las razones por las que pregunto es porque, la wikipedia también dice que el Coeficiente de determinación se denota como $r^2$ o $R^2$ y es igual al "cuadrado del coeficiente de correlación de Pearson".

El hecho de que parece que hay tanto Pearson $r$ y Pearson $R$ y entonces el coeficiente de determinación se denota $r^2$ o $R^2$ me confunde, notablemente hablando.

5voto

Lewian Puntos 296

El residuo de Pearson y la correlación de Pearson son conceptos totalmente diferentes en contextos distintos.

En general, hay muchos más conceptos en estadística que letras (incluso si se está dispuesto a utilizar cuatro alfabetos diferentes), por lo que inevitablemente, al menos si se revisan varios libros y documentos, se utilizará la misma notación para diferentes cosas.

La actitud estándar debería ser que toda la notación debe estar definida específicamente para el libro o el documento que estás leyendo, y que no puedes confiar en saber qué significa la notación a menos que esté explícitamente definida. Si quieres saber qué significa la notación, busca la definición en el texto que estás leyendo; si no está definida, es que está mal escrita.

Dicho esto, sobre todo en el ámbito de la estadística, hay una serie de convenciones que se utilizan de forma bastante generalizada. $r_{xy}$ se utiliza a menudo para la correlación de Pearson (muestra) y $R^2$ se utiliza a menudo para el coeficiente de determinación (que de hecho es el cuadrado de una correlación específica en la regresión estándar), mientras que no he visto $R$ para lo que se llama residuo de Pearson tan a menudo (e incluso el propio término residuo de Pearson no se utiliza universalmente). Utilizando $R$ para el residuo de Pearson y $R^2$ para el coeficiente de determinación en el mismo libro es realmente engañoso; estas cosas deben evitarse, e incluso $R$ y $r$ se utilizan mejor para dos cosas que están claramente relacionadas (como las variables aleatorias y sus realizaciones), pero estas cosas ocurren con bastante frecuencia.

Algunos autores piensan que pueden utilizar la notación convencional estándar sin definición, pero yo no estaría de acuerdo. La base es que las cosas son lo que se define que sean, y no hay ninguna garantía de que la notación sea coherente entre diferentes textos. (Dentro del mismo texto, por supuesto, tampoco puedo garantizarlo, pero el autor debería hacer un esfuerzo).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X