8 votos

Regresión logística para límites diferentes de 0 y 1

Tengo algunos datos; es una proporción $y$ de algunas cosas en relación a todo, así que es acotada entre 0 y 1 por definición. La proporción de los cambios a lo largo del tiempo. Además de bastante alta varianza hay un paso-como el cambio hacia la mitad del período de tiempo; el paso no es muy grande, pero está ahí, y se pasa bastante rápido en relación a la totalidad del período de tiempo. Así que tengo una S-curva, y quiero (y dijeron a) ¿de regresión logística.

Pero: (1) este no es monotono, ni siquiera cerca, debido a la alta varianza. (2) no va de 0 a 1. Más bien, se va de 0,2 a 0,8, si usted mira de los medios. Así que parece que la cosa derecha a hacer será para adaptarse a algo como $a\phi(x)+b$ donde $\phi$ es lo habitual en la logística de la curva en S, por lo que tenemos 4 parámetros por completo.

Lo que me molesta es que nunca he visto un ejemplo de regresión logística utilizado como ese (admito que no viendo demasiados). No es que no estoy seguro de cómo implementar esta ... estoy bastante seguro de que puedo encontrar que, a pesar de indicaciones específicas serán apreciados-pero tengo miedo de que la suposición de que los datos está limitada por los límites de la curva " S " es importante para todas las estimaciones después, así como la bondad de ajuste, el significado del paso, los intervalos de confianza, etc.

Así:

  1. Son mis temores justificados?
  2. Puede que me apunte a un ejemplo relevante en la literatura? No necesariamente literatura estadística, si algunos biólogos (o quien sea) lo uso, eso está bien. O simplemente alguien que hablan de esta posibilidad.
  3. Si de hecho hay problemas con este enfoque, ¿cuáles son las alternativas?

Actualización: Bueno, yo era tan ignorante que no podía hacer las preguntas correctamente. Yo estaba buscando multinomial (aka politómica) de regresión.

5voto

John with waffle Puntos 3472

Usted está buscando las palabras claves equivocadas. La regresión logística es el 0-1 resultados, donde la probabilidad de ser 1 se modela con una forma de S (logística) de la función, no de los puntos de datos reales ellos mismos. Buscando la regresión no lineal, específicamente los parámetros de cuatro modelo logístico: $y = A + (B-A)/(1+\exp(-(a+bx))) + \epsilon$ (puede aparecer con otros el proceso de parametrización). Rellenar encontrar un montón de ELISA material relacionado con si usted busca para este modelo.

Existe software especializado para el montaje de este, y por supuesto, las principales paquetes estadísticos también puede manejar. Por desgracia, si hay una gran cantidad de variabilidad, la estimación podría ser difícil, y el proceso de ajuste podría "no convergen".

3voto

Mike Moore Puntos 641

Para empezar, creo que tenemos que distinguir entre la regresión logística y (generalizada) de la función logística. A pesar de que éste puede ser visto como un caso separado de la ex toma el tiempo como la única variable explicativa. A continuación, es sencillo ver que amueblada proceso pasará por $S$ en forma de ruta que se dirige a su superior (o, probablemente, inferior) límite al $t \rightarrow \infty$. Por lo tanto, moviéndose a lo largo de la $S$ curva es la influencia de más de covariables (no a la vez) que están cambiando hacia arriba y hacia abajo con el tiempo (en el consumo de estas estructuras son el ingreso, los gustos, los precios, etc.). De modo que podría haber saltos o lo que sea, porque nadie restringe la regresión lineal para ir sólo o sólo abajo a la $S$ curva de límites.

Puesto que usted está trabajando con estructuras de $0$ $1$ son límites naturales. Nunca se puede estar seguro de que cualquier otro de los límites no ser golpeado mayor o menor en el futuro, cuando sus conclusiones se basan únicamente en el análisis de datos históricos, y argumentando que el proceso nunca lo hizo no es un caso de razonamiento. Por lo tanto, sus temores son justificados, la regresión logística (pero no el montaje de la curva logística! que viene como una solución determinista de la ecuación diferencial!) funciona muy bien aquí. Preste atención al hecho de que podría haber varias categorías que algunos hasta 1, por lo que necesita multinomial logit modelo para adaptarse a la estructura en este caso.

Entre las alternativas no podía ser de cualquier modelo que podría aplicarse a la elección discreta. Comúnmente utilizado los candidatos son probit y logit modelos. Incluso si usted piensa que no hay una decisión en mi modelo , en realidad, todas las estructuras en el mundo son el resultado de procesos de decisión de resolver por los seres humanos, la naturaleza o los extraterrestres ^_^.

2voto

karatchov Puntos 230

Regresión logística es algo que se suele utilizar para la clasificación y no de regresión. (A pesar del nombre). Así que si usted realmente no abordar un problema de clasificación me parece como raro utilizarlo - sobre todo debido al uso de la función de error de la entropía cruzada.

Alternativamente, sería utilizar una regresión lineal con funciones de base que tienen la forma deseada de la S y la suma de errores cuadrados.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X