6 votos

Asimétrica medida de la no-dependencia lineal/correlación?

Estoy definitivamente no es un estadístico-matemático, así que siéntase libre para que me digan que soy un idiota si lo soy.

Por lo que puedo decir de mi Wikipediaing todas las principales medidas de la dependencia son simétricas y medir la información compartida entre las dimensiones. Estoy buscando un asimétrica método de medición de la dependencia.

Me refiero asimétrica en el sentido de que f(x,y) podría devolver el grado en que x depende de y, donde f(y,x) devuelve el grado en que y depende de x.

Tengo un control significativo sobre qué tipo de datos va a tomar, así que no estoy demasiado preocupado acerca de exactamente cómo iba a manejar la n-dimensional cosas ahora - tenía la intención de dejar que tan abierto como sea posible a fin de no limitar las posibilidades. Continuando con mi anterior notación tal vez la posibilidad de aplicar f(x,y,z) tales que el grado de x puede ser determinado dado y y z se devuelve.

No estoy seguro en mi uso de la terminología así que voy a dar un ejemplo.

Decir que yo tuve un montón de pares x,y, donde y=1 cuando x>0 y y=0 en caso contrario. Básicamente una función de paso. Medir el grado que y depende de x debe dar una salida de alta potencia (idealmente 1) porque y puede ser completamente determinado dado de x. Sin embargo, el grado en que x depende de y es menor que el de salida debe indicar que una relación está presente, pero que x no puede ser completamente determinado y dado.

Desnudo en cuenta que el ejemplo es una simplificación - en el mundo real, estoy interesado en hacer esto con un montón de diferentes conjuntos de datos con un potencial bastante complejo no lineal no-monotónica relaciones. Yo sin embargo tengo mis datos en x,y par formulario.

He reunido una lista de unos pocos no-propiedades esenciales que una solución ideal.

Propiedad Ideal lista de deseos:

  • Salida entre 0, 1
  • Barato de cómputo
  • Capaz de manejar n-dimensional de datos
  • Relativamente fácil de implementar en un no-especializados en el entorno de software

3voto

alexs77 Puntos 36

El R2 de un modelo multivariante de regresión es una medida asimétrica. El modelo de regresión de Y X conduce a una diferente R2 que el modelo de regresión de XY. Esto es debido a que el valor se calcula usando la proporción de la distancia vertical desde la media explicada por la línea de mejor ajuste utilizando la media condicional de Y X para predecir el potencial promedio de los resultados para la Y.

EDIT: En el discurso a continuación, se ha demostrado que el R2 pueden ser conservados y "simétrico". El R2 tiene una aplicación en particular y es útil para resumir grandes dimensiones de los modelos predictivos. En general, la dependencia es un sofisticado concepto matemático, y que rara vez se puede informar mucho acerca de la dependencia entre dos variables sin hacer fuerte (y a menudo comprobable) supuestos. Creo que para el transporte de los aspectos de la relación entre dos variables en un ajuste aplicado, el término "asociación" es mucho mejor.

Para los modelos más pequeños, simplemente utilizando el coeficiente y su intervalo de confianza 95% a partir de un modelo de regresión lineal es suficiente para informar de la primera orden tendencia en los datos. Estos están bien establecidos de la asociación de medidas. Incluso si la tendencia es posiblemente no lineal, un modelo de regresión lineal con un coeficiente que se toma para ser una "regla de oro" diferencia en los resultados para una unidad de diferencia en algunos regresor. Estos serán necesariamente diferentes para los modelos de regresión tratamiento de una Y variable como un resultado o un regresor. Puedo ver los modelos de este formulario presentado a menudo en la literatura con el 20 ajuste de las variables en muestras de gran tamaño.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X