1 votos

Construcción de una variable binaria basada en el ajuste óptimo

Tengo un conjunto de datos que contiene una variable continua (A) que refleja de forma incompleta una variable latente binaria (L), pero que se acerca a la verdad. También tengo información sobre otras variables binarias (B/C/D/E/ ) que también reflejan de forma incompleta la variable binaria latente.

Me gustaría entrenar combinaciones de B/C/D/E en la variable A para crear una nueva variable binaria que represente a L. ¿Sería esto posible? ¿Cómo podría hacerlo, por ejemplo en R o en Stata?

¿Podría hacerse mediante una regresión y predecir una respuesta binaria? Estoy un poco confundido porque mi resultado es continuo, y me gustaría explicarlo con variables binarias para predecir otra variable binaria (A~B+C+D+E ). ¿qué otro método de aprendizaje podría utilizar?

1voto

Neal Puntos 316

Creo que se puede utilizar un modelo de mezcla finita para hacer algo así. En Stata, intente algo como esto:

sysuse auto, clear
ssc install fmm 
ssc install fmmlc
fmm price foreign mpg, comp(2) mixtureof(lognormal)
fmmlc, savec savep

Esto le da la pertenencia a la clase latente más probable y las probabilidades posteriores de la clase latente como 3 variables. Probablemente tendrá que cambiar la lognormal por algo más adecuado para sus datos.

Otras ideas son sem/gsem o gllamm. Hay buenos libros de Stata Press para ambos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X