7 votos

Si dos rasgos tienen una correlación conocida, ¿se puede predecir la probabilidad de que se "alineen" en una pareja aleatoria?

Supongamos que tenemos dos rasgos que están correlacionados en una población determinada, como el IMC de una persona y su presión arterial. Y digamos que quiero estimar la probabilidad de que en un par de personas seleccionadas al azar de esta población, la que tiene el IMC más alto tenga también una presión arterial más alta. Si conozco el coeficiente de correlación de pearson r (o su equivalente r^2, la proporción de la varianza de la presión arterial que se explica por el IMC), ¿puede utilizarse para obtener esa probabilidad? Si no, ¿podría hacerlo utilizando alguna otra medida de correlación, o haciendo alguna suposición simplificadora sobre la relación funcional entre ellas (digamos, asumiendo que la presión arterial en cada individuo es una función lineal del IMC junto con otras variables independientes) y/o la distribución individual de cada una (digamos, asumiendo que tanto el IMC como la presión arterial se distribuyen normalmente)?

0 votos

Si esto es lo que le interesa, podría estimar esto directamente a partir de los datos utilizando el método de Kendall $\tau$ por ejemplo.

6voto

AdamSane Puntos 1825

Narasimhan-Nievergelt's Análisis complejo en una variable es exactamente el libro que quieres.

Es completamente geométrico y le introducirá, partiendo de cero, no sólo en las superficies de Riemann, sino también en la teoría de las funciones holomorfas de varias variables, los espacios de cobertura, la cohomología,...
Este libro único hace hincapié en lo poco que hay que saber de la función clásica de una variable compleja: sólo las cuarenta páginas del capítulo 1, acertadamente llamado Teoría elemental de las funciones holomorfas .
Un libro con una filosofía similar es Análisis complejo de Dolbeault, el de la cohomología de Dolbeault, que tiene el inconveniente de estar en francés (aunque en francés matemático, que está muy lejos del francés de Mallarmé o de Proust...)

Es un hecho infravalorado, que se muestra en estos dos libros, que la mayor parte del material que se encuentra en los libros de análisis complejo de una variable es inútil para el estudio de las superficies de Riemann y, en general, de las variedades complejas.
Por ejemplo, todos los cálculos inteligentes de las integrales reales mediante el cálculo de residuos, la evaluación del radio de convergencia de las series de potencia, los métodos asintóticos, los productos de Weierstraß, las transformaciones de Schwarz-Christoffel, ... son irrelevantes en la geometría analítica compleja: Desafío a cualquiera a encontrar el más mínimo rastro de estos en la obra del recientemente fallecido H. Grauert, posiblemente el mayor especialista del siglo XX en la geometría de los espacios analíticos complejos.

2 votos

Apruebo la respuesta de RobertF ya que vino primero y abordó la mayor parte de lo que estaba preguntando, pero agradezco esta información adicional. Mi impresión de lego es que la mayoría de los estudios estadísticos empíricos que he visto en campos como la medicina / psicología / sociología sólo utilizan r de Pearson o r^2 para describir las correlaciones - si eso es cierto me pregunto por qué la medida de Kendall no se informa más a menudo junto a ella, parecería tener cierta utilidad en la interpretación de los resultados (especialmente cuando se resume para un público no especializado, ya que la idea de elegir un par al azar es intuitiva).

0 votos

De hecho, es una excelente pregunta para reflexionar, y uno bien podría hacer una pregunta similar en relación con una serie de otras cantidades no paramétricas de similar interpretabilidad y simplicidad. [Al menos la correlación de Kendall se utiliza ampliamente en el trabajo con cópulas, tanto en la teoría como en la práctica].

4voto

Zolani13 Puntos 128

No - Conocer la correlación (e incluso la fórmula de regresión lineal) entre dos rasgos no es suficiente para predecir la probabilidad de que un IMC más alto tenga una presión arterial más alta.

Ver El cuarteto de Anscombe para ver un ejemplo visual de cuatro distribuciones distintas con correlaciones idénticas y líneas de regresión lineal ajustadas para ver dónde puede llevarle a equivocarse el hacer predicciones de probabilidad basadas en la correlación.

Si se hacen suposiciones simplificadoras: es decir, una relación lineal entre el IMC y la presión arterial y distribuciones normales, entonces sí, se podría construir intervalos de predicción para las nuevas mediciones utilizando la ecuación de mínimos cuadrados.

Sin embargo, cuando se trabaja con datos del mundo real, yo aconsejaría evitar las suposiciones sobre la distribución de los datos. Una mejor alternativa sería utilizar el bootstrapping para estimar la función de distribución acumulativa.

0voto

wharton12345 Puntos 6

Te recomiendo que aumentes las variables que estás midiendo. La edad, el sexo, la ubicación, etc., ponderarlas en su fórmula para disminuir la probabilidad de falsos negativos. Maximiza tu curva ROC. Sería interesante ver un modelo que mantuviera la misma correlación teniendo en cuenta conjuntos de datos de diferentes décadas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X