Recientemente, he estado interesado en la implementación de un modelo de regresión beta, para un resultado que es una proporción. Tenga en cuenta que este resultado no caben en un binomio de contexto, porque no hay ningún concepto significativo de un discreto "éxito" en este contexto. De hecho, el resultado es en realidad una proporción de duración; el numerador es el número de segundos mientras una determinada condición se activa sobre el total de número de segundos durante los que la condición era elegible para ser activo. Me disculpo por los caprichos, pero no quiero que se centran demasiado en este preciso contexto, porque me doy cuenta de que hay una variedad de formas en las que tal proceso podría ser modelada además de la beta de la regresión, y por ahora estoy más interesado específicamente en cuestiones teóricas que han surgido en mis intentos de llevar a la práctica este modelo (aunque yo soy, por supuesto, abiertos a cualquier sugerencia me señala hacia interesante alternativa estrategias de modelado si usted cree que una beta de la regresión es totalmente inapropiado).
En cualquier caso, todos los recursos que he sido capaz de encontrar han indicado que la beta de la regresión se suelen encajar el uso de un logit (o probit/cloglog) de enlace, y los parámetros que se interpretan como cambios en el log-odds. Sin embargo, todavía tengo que encontrar una referencia que proporciona realmente real de la justificación de por qué uno desea usar este enlace.
El original de Ferrari Y Cribari-Neto (2004) el papel no proporcionar una justificación; se nota que el logit de la función es "especialmente útil", debido a la odds ratio de interpretación de la exponentiated parámetros. Otras fuentes aluden a un deseo de mapa desde el intervalo (0,1) a la línea real. Sin embargo, no nos necesita necesariamente una función de enlace para tal asignación, dado que ya estamos asumiendo una distribución beta? ¿Qué beneficios aporta la función de enlace proporcionan por encima y más allá de las limitaciones impuestas por el supuesto de la distribución beta para empezar? Me he encontrado un par de rápidos simulaciones y no he visto las predicciones fuera de la (0,1) intervalo con una identidad enlace, incluso cuando la simulación de distribuciones beta cuya probabilidad de masa es en gran medida agrupados cerca de 0 o 1, pero tal vez mi simulaciones no han sido lo suficientemente general como para la captura de algunas de las patologías.
A mí me parece que se basa en cómo los individuos, en la práctica, interpretar las estimaciones de los parámetros de la beta modelos de regresión (es decir, como el cociente de probabilidades) que están implícitamente hacer inferencia con respecto a las probabilidades de un "éxito"; es decir, están usando la beta de la regresión como un sustituto de un modelo binomial. Tal vez esto es apropiado en algunos contextos, teniendo en cuenta la relación entre la beta y distribuciones binomiales, pero a mí me parece que esto debería ser más que un caso especial de la general. En esta pregunta, una respuesta para la interpretación de la odds ratio con respecto a la continua proporción más que el resultado, pero a mí me parece innecesariamente complicado para tratar e interpretar las cosas de esta manera, frente a su uso, por ejemplo, un registro de identidad o de enlace y la interpretación de % cambios en la unidad o la cambia.
Así que, ¿por qué usamos el enlace logit para la beta modelos de regresión? Es simplemente como una cuestión de conveniencia, que se relacionan con el binomio modelos?