¿Relación entre el ajuste de la distribución y la regresión simple?

Question

¿Relación entre el ajuste de la distribución y la regresión simple?

Preguntado el 5 de Julio, 2019: Cuando se hizo la pregunta
1084 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Se trata de una cuestión conceptual que me lleva rondando desde hace mucho tiempo.

Basado en un conjunto de datos, $(X_1, X_2, X_3, \ldots, X_k)$ con un tamaño de muestra $i = 1 \ldots n$ ,
¿existe una relación explícita entre

Ajustar una distribución multivariante a todos los datos, y
¿Estimar un modelo de regresión con los mismos datos?

Ambos conceptos parecen muy similares, por dos razones:

Tanto la estimación de modelos de regresión lineal simple como el ajuste de distribuciones pueden realizarse utilizando el mismo método, la estimación de máxima verosimilitud (MLE), y
Después de ajustar una distribución (digamos la Normal) y obtener los parámetros para su pdf, se puede calcular la distribución condicional, $P(X_1 | X_2, X_3, \ldots , X_k)$ lo que permitiría predecir valores para $X_1$ en función de los nuevos valores ( $i = n+1, n+2, \ldots$ ) de $X_2, \ldots X_k$ de forma muy similar a la forma en que uno podría obtener predicciones para $X_1$ realizando la siguiente regresión, con un término de error de distribución normal, $\epsilon$ , $X_1 = \beta_0 + \beta_1X_2 + \beta_2X_3 + \ldots + \beta_{k-1}X_k + \epsilon\, ;$ ambos métodos permiten hacer predicciones con datos nuevos, tras realizar primero algún tipo de ajuste.

Cualquier idea sobre esta conexión (si es que es real), como los pros y los contras de ajustar una distribución frente a estimar un modelo de regresión simple cuando se trata de hacer previsiones, sería muy apreciada.

Preguntado el 5 de Julio, 2019 por kolypto

Answer 1

2 Respuestas

Answer 2

3voto

Dipstick Puntos 4869

La estimación de modelos de regresión lineal, mediante MCO, y el ajuste de distribuciones pueden realizarse utilizando el mismo método, la estimación de máxima verosimilitud (MLE) y la estimación de máxima verosimilitud (MLE). Likelihood Estimation (MLE), y

Sí, tiene razón. Al utilizar la máxima verosimilitud, siempre estamos ajustando algún tipo de distribución a los datos. Sin embargo, la diferencia está entre tipos particulares de distribuciones que estamos encajando.

Sur modelo de regresión estamos prediciendo el media condicional (pero a veces alternativamente otras cosas como mediana, cuantiles, moda) de una variable ( $X_1$ en su notación) dado el otras variables ( $X_2,X_3,\dots,X_k$ ), donde la relación tiene una forma funcional $f$ :

$E(X_1|X_2,X_3,\dots,X_k) = f(X_2,X_3,\dots,X_k)$

así, por ejemplo, con la regresión lineal la distribución supuesta es normal, entonces tenemos

$X_1 \sim \mathsf{Normal}(\,f(X_2,X_3,\dots,X_k),\; \sigma^2\,)$

donde, para la regresión lineal $f$ es una función lineal

$f(X_2,X_3,\dots,X_k) = \beta_0 + \beta_1X_2 + \beta_2X_3 + \ldots + \beta_{k-1}X_k$

pero no tiene por qué ser lineal en otros tipos de modelos de regresión.

Por otra parte, cuando la gente "sólo" ajusta la distribución, suele referirse con ello a la búsqueda de parámetros desconocidos de una conjunta distribución de algunas variables, por ejemplo si utilizamos de nuevo la distribución normal (multivariante), sería algo como

$(X_1,X_2,X_3,\dots,X_k) \sim \mathsf{MVN}(\boldsymbol{\mu}, \boldsymbol{\Sigma})$

Nótese la diferencia, que aquí no asumir ninguna forma funcional específica de relación entre $X_1$ y $X_2,X_3,\dots,X_k$ . En la regresión, elegimos la relación funcional que asumimos para las variables, mientras que al ajustar la distribución, la relación se rige por la elección de la distribución (por ejemplo, en la distribución normal multivariante, se rige por la matriz de covarianza).

Después de ajustar una distribución (digamos la Normal) y obtener los parámetros para su pdf, se puede calcular la condicional condicional, $P(X_1 | X_2, X_3, \ldots , X_k)$ , a predecir valores para $X_1$ en función de los nuevos valores de $X_2, \ldots X_k$ ,

¿Qué quiere decir aquí con "nuevos valores"? El modelo de regresión podría ser algo como

$\mathsf{salary}_i = \beta_0 + \beta_1 \mathsf{age}_i + \beta_2 \mathsf{gender}_i + \varepsilon_i$

Así que si sus datos consistieran en $i=1,2,\dots,n$ individuos, entonces se podrían hacer predicciones sobre el salario para $n+1$ individual, eso no se observó en sus datos. Sin embargo, si eligió otra característica para el modelo, por ejemplo $\mathsf{height}_i$ entonces el modelo de regresión estimado no te dice nada sobre la relación entre altura y salario. Yo no llamaría a las características como "nuevos valores" porque sería muy engañoso.

de forma muy similar a como se podría g $X_1$ mediante la siguiente regresión $X_1 = \beta_0 + \beta_1X_2 + \beta_2X_3 + \ldots + \beta_{k-1}X_k + \epsilon\, ;$ ambos métodos permiten hacer predicciones con datos nuevos, después de realizar primero realizar algún tipo de ajuste.

Tienes razón en que si conocemos las distribuciones conjuntas $p(X_1,X_2,X_3,\dots,X_k)$ y $p(X_2,X_3,\dots,X_k)$ podemos estimar el distribución condicional ,

$p(X_1|X_2,X_3,\dots,X_k) = \frac{p(X_1,X_2,X_3,\dots,X_k)}{p(X_2,X_3,\dots,X_k)}$

o expectativas condicionales, etc. Sin embargo, la diferencia es que con la regresión esto está disponible de inmediato, mientras que en el caso de la distribución "bruta", tendría que calcularlos a partir de la distribución (por ejemplo, tomar integrales o realizar una simulación Monte Carlo).

Observe también que con la regresión no puede "volver" a la distribución conjunta, ni estimar otros tipos de distribuciones condicionales (o expectativas). Así que la regresión es un caso simplificado. "Simplificado" no es malo en este caso, por ejemplo, ser simplificado significa que necesitaría muchos menos datos para obtener una estimación fiable en comparación con un modelo más complicado.

Respondido el 9 de Julio, 2019 por Dipstick (4869 Puntos )

Answer 3

0voto

Owen Mundy Puntos 103

Si le he entendido bien, creo que una distinción que se ha hecho en la literatura es la que existe entre los modelos discriminativos que aprenden $p(y|x)$ y modelos generativos que aprenden $p(x,y)$ .

El tratamiento teórico y experimental más exhaustivo de esta distinción puede consultarse en este estudio

Respondido el 10 de Julio, 2019 por Owen Mundy (103 Puntos )

¿Relación entre el ajuste de la distribución y la regresión simple?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Relación entre el ajuste de la distribución y la regresión simple?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: