Supongamos que quieres adivinar el peso de alguien, pero sólo conoces su altura. ¿Cómo podrías hacerlo?
Si tuvieras acceso a las medidas de la altura y el peso de muchas personas, podrías dibujar un gráfico con la altura y el peso en los ejes y poner puntos en los puntos de cada par de medidas. Lo que se vería es una tendencia general a que las personas más altas pesen más, pero hay mucha dispersión en torno a esta tendencia.
La regresión es el proceso de utilizar alguna técnica para estimar la relación típica entre la altura y el peso. Por lo tanto, después de hacer el análisis de regresión podrías decir
Typically, someone who is 1.8 metres tall weights about 80Kg, but someone 2
metres tall weighs around 100Kg.
Por supuesto, muchas personas que miden 1,8 metros pesan más o menos de 80 kg, pero su análisis podría decir que a falta de cualquier otra información tu mejor estimación para su peso es 80Kg. El análisis de regresión te indica cómo cambia este valor típico de peso con la altura, es decir, las personas más altas suelen pesar más.
La regresión no se limita a que una variable prediga otra, por ejemplo, ¿qué pasaría si también conociéramos el sexo biológico de cada persona? Después de hacer un análisis de regresión podríamos decir
Males that are 1.8 metres tall typically weigh around 85Kg but Females
weigh around 75Kg.
Ten en cuenta que me acabo de inventar todas estas cifras. Las cifras reales dependerían de un análisis de regresión sobre un conjunto de datos reales (que no he realizado para esta explicación rápida).