4 votos

Calcular un Pvalue desde el promedio de Pearson y de Spearman rho

Por un lado, la correlación de Pearson es sensible a los valores atípicos, mientras que el de Spearman no lo es. Por otro lado, si usted tiene datos cuantitativos, Spearman se tratan como los datos ordinales.

  1. Cómo sobre un promedio de Pearson y Spearman rho? Es que de fiar? Si existe una correlación causados sólo por los valores extremos, la media debe ser menos sensible. Y cuantitativa de la información no es completamente ignorado.

  2. La importancia de ambos Pearson y Spearman rho puede ser calculada como $t= \rho \sqrt {\text{df}/(1-\rho^2)}$. Puedo aplicar el mismo para obtener el $t$-estadística y la $P$-valor de este promedio $\rho$ valor?

4voto

AdamSane Puntos 1825

si usted tiene datos cuantitativos, Spearman se tratan como los datos ordinales.

Bueno, algo así. Sin duda es el caso de que cualquier monotónica creciente transformación de las observaciones no alterar la correlación, y sólo el orden de clasificación de las observaciones de la materia. Eso no es absolutamente la misma cosa que los datos originales de tener ordinal categorías (a la que por lo general tienden a inducir lazos en los datos, por ejemplo).

Cómo sobre un promedio de Pearson y Spearman rho? Es que de fiar?

Depende de a qué te refieres con "de fiar".

Si existe una correlación causados sólo por los valores extremos, la media debe ser menos sensible.

Considere la posibilidad de que en lugar de tener un valor de población para el 'contaminada' de correlación, $\rho^*$ que usted no piensa que es útil (porque es " sólo causados por los valores atípicos), se prefiere un valor cercano a $\frac12\rho^*$... es que realmente más significativos? En la mayoría de las situaciones, posiblemente no.

O pensar en términos de la estimación de la incontaminada de correlación, considere la posibilidad de este caso, donde una fuerte correlación positiva se hace aún más fuerte en negativo:

enter image description here

El "promedio" de correlación es aún negativo. Es más útil que el simple hecho de Spearman? En este caso no.

Y cuantitativa de la información no es completamente ignorado.

No creo que la información cuantitativa es "completamente ignorados" por la correlación de Spearman, ya que el orden de clasificación es determinada por ella; sólo el adicional de información posible en lo que existe por encima de lo que el orden de clasificación contiene que puede ser añadido. Para muchas distribuciones, que en realidad no hacen ninguna contribución útil, e incluso en la distribución normal, sólo añade un pequeño porcentaje más información.

La importancia de ambos Pearson y Spearman rho puede ser calculada como $t=\rho\sqrt{\frac{\text{df}}{1-\rho^2}}$. Puedo aplicar el mismo para obtener el t-estadístico y el valor p de esta promedió un valor de ro?

Posiblemente (lo dudo, pero habría que comprobarlo).

La gran pregunta es si esto significa mucho para hacerlo. Sólo se podía mejorar la eficiencia en la normal por la más mínima cantidad, pero perderá la mayor parte del valor que es traída por el más robusto de la medida.

3voto

Nick Cox Puntos 22819

Un promedio de Pearson y de Spearman es una idea original, pero en la práctica sólo se evita el problema fundamental de lo que se debe estimar en forma arbitraria.

¿Por qué no usar los pesos de otros de igual peso, 0,7 Spearman y 0,3 de Pearson o de Spearman 0.3 y Pearson 0.7? No hay nada automático en la elección de los pesos de 0.5 y 0.5, fuera de un recurso de apelación a la simplicidad.

No es como si hay un Platónico de la entidad a la que llamamos "la correlación" que estamos buscando, como el Santo Grial. La perspectiva de "Lo que estamos estimando aquí?" es siempre vale la pena seguir y la respuesta tendría que ser que el promedio de Spearman y Pearson es sólo la estimación de la misma medida en la población. Como que es altamente no-estándar de procedimiento (es decir, nunca he visto a esta propuesta antes de que) usted tendrá que explicar por que y vender a una audiencia o lectores.

Siempre Spearman y Pearson correlación de acuerdo, como es muy común, la cuestión clave es que la correlación tiene más sentido para el análisis y si otros enfoques más sentido en turno. Trabajar con una u otra variable en una escala transformada es una forma común de avanzar.

Nota. Cómo obtener los valores de P para mí es un tema secundario, ya que no vea que esto es una buena idea alguna manera. Si usted se determinaron, usted podría tratar de bootstrap para obtener los intervalos de confianza. Pero cuando hay un valor atípico presente, entonces bootstrap muestras se dividen claramente en aquellos que no contiene copias de los demás y aquellos que contienen uno, dos, ... copias de los valores atípicos. La distribución de muestreo es lo que va a ser multimodal.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X