6 votos

Inversa de regresión logística vs de medidas repetidas vs latente de la clase?

Como sugiere el título, estoy bastante confundido acerca de qué enfoque tiene más sentido para mi de datos. Déjame que te explique brevemente el problema.

Tengo la opción binaria de datos que representa si una persona específica para un determinado evento, tomó el tren o el autobús. Tengo nivel de evento predictores (lugar del evento, la duración del evento), así como de la persona a nivel de los predictores (nivel de ingresos, nivel de educación). Hay varios, pero desequilibrada, eventos por persona.

Aquí está el poco inusual parte: tengo un montón de histórico info con todos los valores predictores así como se observa elección. Quiero construir un modelo de regresión de que luego se pueden aplicar a los nuevos datos (que consiste en todo, excepto en el nivel de educación) para inferir con tanta confianza como sea posible, que la educación de la persona, basándose en su observó opciones.

Mis pensamientos sobre cómo hacer esto:

  1. Crear un efecto mixto, multinivel modelo de regresión logística, con la opción de transporte como mi variable dependiente, y education_level como uno de los predictores. Ahora resolver para education_level el uso de algo como la inversa de regresión logística.
  2. Hacer una regresión en cuenta. Ahora, la educación es la variable dependiente, y se resumen los recuentos de cada subconjunto de variables predictoras hemos visto (por ejemplo, hubo 5 eventos cercanos en el que los ricos hombres tomó el autobús, 3 lejana eventos donde...)
  3. Algún tipo de latente modelo de clase?

¿Cuáles son los pros y los contras de estas alternativas? También, existen todavía otros enfoques, vale la pena examinar (por ejemplo, CFA)?

(Y por favor, hágamelo saber si tengo que dar más detalles sobre el problema.)

Gracias por su tiempo, Ian.

1voto

rjmunro Puntos 10522

Mi primer pensamiento sería la regresión de la educación (usando una proporción de probabilidades del modelo o lo que sea apropiado para su variable de educación) en la persona de variables de nivel y unas sencillas opción de transporte para los agregados. La variable principal que viene a la mente es la proporción de tren vs bus (%tren), pero si sólo tiene dos sucesos a nivel de las variables-distancia y duración-a continuación, otra opción sería la de %de tren cerca, %tren-lejos, %tren-corto, %tren de largo.

Si algo tan simple como el de arriba no funciona porque tiene demasiados caso las variables de nivel o no está dispuesto a clasificar, a continuación, su primer pensamiento de mediante una regresión logística con efectos aleatorios para la persona que las variables de nivel (supongo) es la idea correcta. Sin embargo, me gustaría modificar su propuesta, mediante un modelo de ecuaciones estructurales (SEM) para la regresión de la educación en la opción de transporte, que es a su vez una regresión en caso de persona y a nivel de las variables (excepto para la educación) y el de efectos aleatorios. La educación, además, puede ser retrocedido directamente en el evento y la persona que las variables de nivel. Todas las regresiones se estiman simultáneamente. Esto se puede hacer en Mplus, pero en la actualidad no es posible en R, por lo que yo sé, porque ninguno de los SEM paquetes (lavaan, sem, por ejemplo) permiten efectos mixtos como los que ofrece el paquete lme4. Probablemente se puede hacer en SAS con un montón de codificación. Ninguna idea sobre otro software.

Es su segundo pensamiento de la regresión de la educación en las combinaciones de su predictores factible dado el número de combinaciones y la cantidad de datos? Cuántos evento y la persona que las variables de nivel tienen?

Latente clase de regresión no tendría sentido para sus datos porque los patrones de respuesta no son comparables (por ejemplo, la persona 1 podría haber elegido 00 para cerca de corto, cerca de corto y persona 2 podría haber elegido 0000 para largo, muy largo, muy largo, muy largo, podría recode vectores de respuesta con una gran cantidad de valores perdidos, pero hay mejores enfoques).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X