6 votos

Análisis de la regresión logística cuando no se utiliza una variable dependiente dicotómica

Estoy teniendo algunos problemas para entender cómo se puede utilizar la regresión logística con una variable dependiente que no es binaria o dicotómica, sino entre proporciones de 0 y 1. Si alguno de vosotros me puede iluminar sería maravilloso. Hasta ahora lo máximo que puedo averiguar es que si utilizara una regresión lineal los valores que obtendría no tendrían sentido porque irían por encima de 1 o por debajo de 0 pero lo que no entiendo y no encuentro a nadie que lo haga es utilizar la regresión logística para predecir cuántas personas están evacuando durante un intervalo de tiempo determinado (en este caso 1 hora) y si puedo hacerlo. Además para mis variables estoy usando datos continuos, dicotómicos y ordenados.

Se agradece cualquier ayuda.

Editado para eliminar la parte de esta pregunta que añadí a otra pregunta.

También para daros un poco más de información. Estoy creando un modelo que prediga la proporción de los que evacuaron con respecto a la población restante en una zona. Por ejemplo, el 10 por ciento evacuó/el 90 por ciento se fue y así sucesivamente durante 37 horas. Los datos se utilizan de forma secuencial, donde cada hora anterior afecta al valor de cada hora posterior. En la literatura lo llaman modelo logit secuencial. Actualmente estoy usando la función de modelo lineal generalizado de matlabs usando una distribución binomial unida a un logit.

4voto

mahsa Puntos 16

Un método razonable y útil, en esta situación, es la regresión Beta. Puede ver mi respuesta a ¿Por qué mis valores p son tan altos? .

3voto

Ted Puntos 854

En su caso, la variable de respuesta es realmente binaria, simplemente se ha resumido en una proporción. Cada individuo puede salir del edificio (1) o no (0). Por lo tanto, la regresión logística es bastante apropiada, sólo hay que poner los datos en una forma apropiada (que dependerá de su software).

En R se hace esto haciendo que la proporción sea la respuesta y especificando los tamaños de la población (es decir, el número de ensayos) como pesos.

Parece que también tiene algunas preguntas sobre las pruebas de hipótesis y la selección de modelos, pero quizá sea mejor plantearlas en una pregunta separada, quizás después de que esté satisfecho con el tema de la regresión logística.

1voto

Sean Hanley Puntos 2428

No quiero quejarme, pero tienes dos preguntas que parecen estar estrechamente relacionadas en las que ninguna de ellas es lo suficientemente clara / tiene suficiente información como para obtener una respuesta realmente buena. Tal vez quieras ver si puedes editarlas. @PeterEllis ha dado una buena respuesta a la pregunta sobre por qué los valores p pueden ser altos. No veo qué más hay que decir al respecto. También ha proporcionado una buena respuesta aquí, pero tal vez pueda ayudar.

@PeterEllis tiene claramente razón en que sus proporciones provienen de algún número de éxitos y algún número de fracasos. Si conoces esos valores, puedes usarlos directamente como tu variable de respuesta. Sin embargo, si no los conoces, tienes un problema. Podrías aventurar una conjetura; la eficacia de ésta dependería de la calidad de tu conjetura. Si tuvieras el mismo número de casos que componen cada proporción, podrías simplemente convertir las proporciones directamente con la transformación logística, es decir ln( proportion/(1-proportion) ) y ejecutar una regresión ols normal con los datos transformados como su variable de respuesta. El único problema es que sus intervalos de confianza/valores p serían inexactos debido a que está contando cada proporción como 1 dato en lugar del número de datos que componen la proporción. No obstante, si el mismo número de casos constituyera cada proporción, las estimaciones de los parámetros serían insesgadas. Además, este enfoque le libraría del problema de tener valores predichos fuera del rango (0,1).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X