Estoy definitivamente no es un estadístico-matemático, así que siéntase libre para que me digan que soy un idiota si lo soy.
Por lo que puedo decir de mi Wikipediaing todas las principales medidas de la dependencia son simétricas y medir la información compartida entre las dimensiones. Estoy buscando un asimétrica método de medición de la dependencia.
Me refiero asimétrica en el sentido de que f(x,y) podría devolver el grado en que x depende de y, donde f(y,x) devuelve el grado en que y depende de x.
Tengo un control significativo sobre qué tipo de datos va a tomar, así que no estoy demasiado preocupado acerca de exactamente cómo iba a manejar la n-dimensional cosas ahora - tenía la intención de dejar que tan abierto como sea posible a fin de no limitar las posibilidades. Continuando con mi anterior notación tal vez la posibilidad de aplicar f(x,y,z) tales que el grado de x puede ser determinado dado y y z se devuelve.
No estoy seguro en mi uso de la terminología así que voy a dar un ejemplo.
Decir que yo tuve un montón de pares x,y, donde y=1 cuando x>0 y y=0 en caso contrario. Básicamente una función de paso. Medir el grado que y depende de x debe dar una salida de alta potencia (idealmente 1) porque y puede ser completamente determinado dado de x. Sin embargo, el grado en que x depende de y es menor que el de salida debe indicar que una relación está presente, pero que x no puede ser completamente determinado y dado.
Desnudo en cuenta que el ejemplo es una simplificación - en el mundo real, estoy interesado en hacer esto con un montón de diferentes conjuntos de datos con un potencial bastante complejo no lineal no-monotónica relaciones. Yo sin embargo tengo mis datos en x,y par formulario.
He reunido una lista de unos pocos no-propiedades esenciales que una solución ideal.
Propiedad Ideal lista de deseos:
- Salida entre 0, 1
- Barato de cómputo
- Capaz de manejar n-dimensional de datos
- Relativamente fácil de implementar en un no-especializados en el entorno de software