25 votos

¿Por qué Pearson es paramétrico y Spearman no paramétrico?

Aparentemente, el coeficiente de correlación de Pearson es paramétrico y el rho de Spearman es no paramétrico.

Tengo problemas para entender esto. Según tengo entendido Pearson se calcula como $$ r_{xy} = \frac{cov(X,Y)}{\sigma_x\sigma_y} $$ y Spearman se calcula de la misma manera, excepto que sustituimos todos los valores por sus rangos.

Wikipedia dice

La diferencia entre el modelo paramétrico y el no paramétrico es que el primero tiene un número fijo de parámetros, mientras que el segundo hace crecer el número de parámetros con la cantidad de datos de entrenamiento.

Pero no veo ningún parámetro excepto las propias muestras. Algunos diga que las pruebas paramétricas asumen distribuciones normales y pasan a diga que Pearson sí asume datos con distribución normal, pero no veo por qué Pearson exigiría eso.

Así que mi pregunta es qué significan paramétrico y no paramétrico en el contexto de la estadística. ¿Y cómo encajan Pearson y Spearman en este contexto?

17voto

Factor Mystic Puntos 12465

El problema es que hoy en día "no paramétrico" tiene dos significados distintos. La definición de Wikipedia se aplica a cosas como el ajuste de curvas no paramétrico, por ejemplo mediante splines o regresión local. El otro significado, más antiguo, es más parecido a "sin distribución", es decir, técnicas que pueden aplicarse independientemente de la distribución supuesta de los datos. Este último es el que se aplica a la rho de Spearman, ya que la transformación de rango implica que dará el mismo resultado independientemente de cuál fuera su distribución original.

3voto

Aksakal Puntos 11351

Creo que la única razón por la que el coeficiente de correlación de Pearson se llamaría paramétrico es porque se puede utilizar para estimar los parámetros de la distribución normal multivariante. por ejemplo, distribución normal bivariante tiene 5 parámetros: dos medias, dos varianzas y el coeficiente de correlación. Este último puede estimarse con el coeficiente de correlación de Pearson.

Por lo demás, tienes toda la razón, para computar Pearson $\rho$ no necesitas hacer ningún supuesto de distribución. Es sólo que cuando se asume una distribución normal, la correlación de Pearson tiene significados adicionales a diferencia de Spearman o Kendall.

1voto

HighCommander4 Puntos 9962

Creo que la respuesta más sencilla es que la prueba rho de Spearmen utiliza datos ordinales (números que se pueden clasificar, pero que no dicen nada sobre el intervalo entre los números; por ejemplo, 3 sabores de helado se clasifican como 1, 2 y 3, pero esto sólo dice qué sabor se prefiere, no cuánto). Los datos ordinales no pueden utilizarse en pruebas paramétricas.

La prueba r de Pearson utiliza datos de intervalo o razón (números que tienen intervalos fijos, por ejemplo, segundos, kg, mm). 1 mm no sólo es más pequeño que 5 mm, sino que se sabe exactamente cuánto por. este tipo de datos se puede utilizar en una prueba paramétrica.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X