5 votos

Cómo medir la correlación entre la varianza y rango?

Tengo una variable independiente es una manipulación/predictor que se aplica en el aumento de grados de la fuerza a través de los grupos. La variable independiente altera la cantidad de variación en la variable dependiente.

Porque estamos buscando la varianza, no puedo utilizar el Rho de Spearman para calcular la correlación sin una extraña hack (detallado a continuación).

¿Cuál es la mejor manera de medir la correlación de la varianza?

En la no-términos matemáticos, estoy probando si el aumento de la utilización de una metáfora/modelo mental unifica las respuestas. Si el modelo mental que altera la forma de pensar de la gente acerca de un problema, a continuación, el aumento de la "recordatorios" de este modelo mental debe unificar las respuestas.

Hay 5 grupos independientes, 0-4, clasificados según el número de "recordatorios" en cada uno de ellos. Como los recordatorios son cualitativamente diferentes, debo uso de rangos.

Si uno examina la SD de cada grupo de acuerdo al rango, se alinean casi a la perfección:

SD - grupo

desplegable

  • .639 - menú desplegable

los botones de la radio

  • .604 - vertical
  • .484 - horizontal

control deslizante

  • .5515
  • .4504 de color

Promedios De Grupos

  • .639
  • .544
  • .501

Esa es una diferencia de ~15% ~8%, aunque una muy áspera y de forma indirecta de medir el cambio en la varianza. Sin embargo, Bartlett y el test de Levene de las pruebas confirman una diferencia estadísticamente significativa en la varianza entre los grupos.

Sin embargo, ni la de Spearman ni Kendall vistazo a la varianza directamente, por lo que una diferencia de -1 y +1 se niegan unos a otros con estas medidas. Si puedo combinar las dos puntuaciones extremas (0-1-2 -> 0-1) luego me sale una Spearman de .142 con un sig <.001.

Aunque creo que este es un defendible hack, no parece coincidir con mi análisis ad-hoc de arriba.

2voto

fsmart Puntos 550

Usted podría modelar la varianza de la especificación explícita de una compartido media y sólo la varianza con un Máximo de Probabilidad de la Formación, tales como

$$ \max_{\hat\gamma_0,\hat\gamma_1} (\sum_{i=1}(ln(D(x_i, \hat\mu, \hat\gamma_0+\hat\gamma_1 rank)))$$

Donde D es el PDF de una distribución de su elección en la cual la media es especificado como primer argumento ($\mu$) y el segundo argumento especifica la varianza.

Voy a mostrar cómo hacer esto en R mediante una distribución normal.

Esto no directamente te dan una correlación entre el rango y la varianza, pero puede aproximarse a una correlación transformando el coeficiente (el uso de $cor(x,y)=cov(x,y)/sd(x)sd(y)$ $\hat \beta=cov(x,y)/var(x))$ $$\hat {cor}_{rank,var}=\hat\gamma_1 \hat {sd({\gamma_1})}/\hat {sd}({rank})$$

Nota, porque $\hat \beta=cov(x,y)/var(x))$ sólo es cierto en OLS por encima de la transformación es, en el mejor de los casos sólo una aproximación.

Pero en realidad, no necesitan de la "correlación" cuando usted tiene un más que interesante estadística generada directamente desde el MLE de estimación: "¿Cómo varianza cambio con respecto a una unidad de cambio en la clasificación?"

1voto

Eric Davis Puntos 1542

Una opción es el informe de la relación de la mayor a la menor desviación estándar o el coeficiente de la más grande a la más pequeña de la varianza para los dos grupos. Esa medida es más comparable que el raw diferencia en la desviación estándar o la varianza con los diferentes estudios que se encuentran en diferentes escalas.

1voto

dez Puntos 146

Quizás esta solución es demasiado simplista. Si es así, ¿podría por favor proporcionar una referencia para demostrar que estoy equivocado?

Lo que si tomamos la regresión de DV con respecto al caso/control CV y todos los factores de confusión y, a continuación, aplicar el test de Levene prueba a los residuos? Ya sólo nos preocupa acerca de la variabilidad en dv entre los grupos definidos por los valores de cv, vamos a retroceder a cabo todos los factores de confusión iv1, iv2, etc. de la siguiente manera:

library('lawstat')
library('xlsx')
d <- read.xlsx('DV-CV-and-confounders.xlsx',1)
m <- lm(dv ~ cv*(iv1 + iv2), data = d, na.action = na.omit)
levene.test(m$residuals, cv, 
        location="median", correction.method="zero.correction", 
        bootstrap=TRUE,num.bootstrap=1000)

0voto

shybovycha Puntos 106

Suena como un análisis de una tabla de 3x3. Cómo sobre un log-lineal de análisis apropiado de los odds ratios de los efectos?


Más ediciones

Loglineal análisis de regresión se utiliza para describir el patrón de los datos en una tabla de contingencia. Un modelo está construido para predecir el logaritmo natural de la frecuencia de cada celda de la tabla de contingencia. Para una tabla de 2x2, eso significa que el modelo es $\ln f = br * row + bc * col + bi * int + a $.

Sus datos parece ser un 3x3, tres niveles de respuesta (0,1,2) por tres condiciones (regulador,de color slider,desplegable). Usted podría construir un modelo para predecir el logaritmo natural de la frecuencia de cada celda de la tabla de contingencia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X