4 votos

Uso de estimadores OLS en modelos binarios

Tengo una pregunta simple y tal vez banal, pero no he encontrado una explicación clara en internet, por eso pregunto.

Cuando tenemos un modelo en el que la variable dependiente es una Dummy (modelo binario), ¿por qué tenemos que utilizar el método de estimación de máxima verosimilitud para encontrar los estimadores de los parámetros, y en cambio no podemos utilizar el método de mínimos cuadrados?

7voto

dan90266 Puntos 609

Hay muchas razones para elegir un modelo que refleje realmente el proceso de generación de datos.

  1. Un modelo adaptado a Y binario no dará predicciones fuera de [0,1]
  2. El modelo no requerirá que se le añadan interacciones de apariencia tonta sólo para mantener la restricción [0,1]
  3. Cuando no se cumple la normalidad de los residuos (tal y como necesita OLS), las inferencias estadísticas serán incorrectas (valores p, intervalos de compatibilidad, etc.)

7voto

Aksakal Puntos 11351

En realidad, la función de pérdida cuadrática $\mathcal L (y,\hat y)=(y-\hat y)^2$ y OLS pueden aplicarse a salidas binarias. Algunos lo hacen. Sin embargo, cuando la variable dependiente (VD) es binaria, normalmente, la pérdida de entropía cruzada $y \ln \hat y$ se utiliza.

Entonces, ¿de dónde viene esta pérdida de entropía? De hecho, la verdadera pregunta es: ¿cómo se elige una función de pérdida? ¿Por qué una pérdida cuadrática, por qué no un porcentaje absoluto ( APE ) pérdida $|(y-\hat y)/y|$ o pérdida absoluta $|y-\hat y|$ ?

Una forma de llegar a cualquier función de pérdida es a través de un análisis probabilístico como la estimación de máxima verosimilitud (MLE). Para la configuración de regresión común como $y=X\beta+\varepsilon$ bajo supuestos a menudo razonables, con la MLE se llega a la conocida función de pérdida cuadrática.

Sin embargo, para la VD binaria suelen ser más adecuados modelos como el logit $y=\frac{e^{X\beta}}{1+e^{X\beta}}$ o en otra formulación $y=\mathrm{logit}(X\beta)$ . La función logit produce resultados entre 0 y 1, y a veces puede interpretarse como la probabilidad de la categoría. No es inmediatamente obvio si la pérdida cuadrática se puede utilizar en este caso.

Resulta que cuando se aplica MLE a este problema En este caso, también bajo supuestos razonables, la función de pérdida tiene una forma diferente: a entropía cruzada .

Esta era sólo una forma de argumentar la pérdida de entropía cruzada en los problemas de DV binario. No es la única manera, y ni siquiera es necesariamente la mejor. Una alternativa sería empezar por minimizar las pérdidas reales que importan a sus clientes. Se expresarían las pérdidas en dólares o en desutilidad, y se trataría de minimizarlas. Este tipo de análisis podría conducir a una función de pérdidas completamente diferente. Rara vez se lleva a cabo porque es demasiado difícil.

2voto

ssn Puntos 472

Si se hace ingeniería inversa de OLS, se verá que en realidad es la solución de máxima verosimilitud gaussiana. Así que, en cierta medida, cuando lo usas estás asumiendo que los datos son condicionalmente gaussianos.

Si se tiene una variable binaria, pero se confía en que la hipótesis gaussiana se mantiene, entonces OLS no sólo es razonable, sino que es prácticamente la mejor opción (sin entrar en priores y MAP aquí), ya que coincide con la hipótesis de distribución de los datos.

Ahora bien, las variables binarias no suelen seguir los supuestos de la gaussiana condicional (por ejemplo, no son continuas, lo que da lugar a una arquitectura residual muy artificiosa).

Un supuesto de distribución muy natural es entonces el Bernoulli, que describe una variable aleatoria binaria. Si asumes Bernoulli, entonces por la misma lógica llegarás a sus estimadores de máxima verosimilitud.

0 votos

"Si tiene una variable binaria, pero confía en que se cumpla la hipótesis gaussiana" es un oxímoron.

0 votos

@FrankHarrell Es una situación artificiosa, sí, pero con la estructura adecuada en residuales es técnicamente posible. Pero añado más en los párrafos siguientes para dejar claro que es muy poco probable

0 votos

Ni siquiera veo cómo eso es técnicamente posible.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X