Estoy tratando de escribir un programa simple que pueda tomar un conjunto arbitrario de datos de pares [x,y] de un archivo dado, analizar e imprimir cualquier característica estadística interesante.
De las cosas que me interesan, es imprimir alguna descripción estadística de los datos basada en cosas como la correlación estadística. Pero ahora mi problema es que no hay información dada al programa sobre la distribución de probabilidad de la que se tomó la muestra, y por lo tanto cosas como Cov(X,Y) parecen evadirme desde la fórmula:
$$Cov(X,Y)=\langle XY\rangle - \mu_x\mu_y$$
requiere que sea capaz de calcular la Expectativa de XY, lo que a su vez requiere que conozca la función de densidad de probabilidad de la fuente. Entonces, ¿qué puedo hacer para obtener la $Cov(XY)$ cuando sólo puedo calcular $mean(x), mean(y) ,var(x) $ y $var(y)$ ?
Eventualmente, estoy interesado en decir algo sobre la correlación entre X e Y.