9 votos

Midiendo la correlación de redes neuronales entrenadas

Estoy entrenando una red neuronal artificial (retropropagación, feed-forward) con datos no distribuidos de manera normal. Además del error cuadrático medio, la literatura a menudo sugiere el coeficiente de correlación de Pearson para evaluar la calidad de la red entrenada. Pero, ¿es razonable el coeficiente de correlación de Pearson si los datos de entrenamiento no están distribuidos normalmente? ¿No sería más razonable usar una medida de correlación basada en rangos, por ejemplo, rho de Spearman?

11voto

jldugger Puntos 7490

El coeficiente de correlación de Pearson mide la asociación lineal. Al estar basado en momentos centrales empíricos de segundo orden, está influenciado por valores extremos. Por lo tanto:

  • La evidencia de no linealidad en un gráfico de dispersión de valores reales frente a los valores predichos sugeriría usar una alternativa como el coeficiente de correlación de rangos (Spearman);

    • Si la relación parece ser monótona en promedio (como en la fila superior de la ilustración), un coeficiente de correlación de rangos será efectivo;

    • De lo contrario, la relación es curvilínea (como en algunos ejemplos de la fila inferior de la ilustración, como el más a la izquierda o el de forma de U en el medio) y es probable que cualquier medida de correlación sea una descripción inadecuada; usar un coeficiente de correlación de rangos no resolverá esto.

  • La presencia de datos atípicos en el gráfico de dispersión indica que el coeficiente de correlación de Pearson puede estar exagerando la fuerza de la relación lineal. Podría ser correcto o no; úsalo con la debida precaución. El coeficiente de correlación de rangos podría ser mejor o no, dependiendo de cuán confiables sean los valores atípicos.

Ejemplos de gráficos de dispersión y sus correlaciones de Pearson

(Imagen copiada del artículo de Wikipedia sobre coeficiente de correlación de momentos del producto de Pearson.)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X