1 votos

¿Cómo predecir la respuesta categórica?

Intento predecir una respuesta categórica utilizando varias variables categóricas y cuantitativas. He probado el modelo de regresión lineal en R, pero no creo que funcione bien ya que la respuesta es categórica.

¿Hay alguna forma de predecir la respuesta categórica? ¿Algún libro recomendado o pdf en línea?

Gracias.

2 votos

¿Cuántas categorías hay? ¿Están ordenadas?

4voto

Dario Castañé Puntos 131

Me sorprende que nadie haya mencionado los métodos no regresivos. Aunque la regresión logística y la politómica/multinómica son ciertamente opciones viables aquí, no son las únicas. Lo que usted está tratando de hacer generalmente cae bajo el paraguas de lo que los estadísticos generalmente llaman "métodos de clasificación". Si hace una búsqueda en la web con ese término, encontrará todo tipo de métodos no regresivos para su análisis. Por ejemplo, podría intentar predecir las categorías utilizando el análisis discriminante, los métodos no paramétricos del vecino más cercano (uno de mis favoritos), el árbol de decisión, etc.

Ya que pidió un libro en línea, podría investigar el libro de descarga gratuita Elementos del aprendizaje estadístico aunque no es mi libro favorito (ya que la notación parece cambiar de una página a otra), pero parece ser ampliamente utilizado y aborda muchos enfoques diferentes a su pregunta.

3voto

Snoi Puntos 13

Parece que necesitas realizar una regresión logística, y te interesa hacerlo en R.

Si su variable categórica dependiente es ordinal, esto puede serle útil: http://www.ats.ucla.edu/stat/r/dae/ologit.htm

De lo contrario, si su variable categórica dependiente es nominal, pruebe esto: http://www.ats.ucla.edu/stat/r/dae/mlogit.htm

0voto

Noel Puntos 26

Sí, los demás tienen razón en que la regresión logística es el área que quieres investigar. Básicamente vas a tener dos opciones. Si tiene más de dos categorías de resultados, lo que desea es una respuesta ordinal o multinomial "normal". Si sus datos están en algún orden significativo, el ordinal podría producir algunos beneficios, pero los supuestos necesarios para ese modelo son bastante estrictos. Asegúrese de probar ambos enfoques.

Otra cosa que deberías considerar es lo que yo llamo multinomio "desagregado". Si tiene N categorías en su variable de respuesta, entonces el modelo multinomial es N-1 ecuaciones de regresión logística anidadas dentro de un único modelo, en el que todas las variables del lado derecho son las mismas en todas las ecuaciones. Si lo desea, puede personalizar estas ecuaciones, de modo que la ecuación para el tipo de respuesta 1 es diferente de la ecuación para el tipo de respuesta 2,3...N . El artículo de la wikipedia: http://en.wikipedia.org/wiki/Multinomial_logistic_regression#As_a_set_of_independent_binary_regressions sobre la regresión logística multinomial ofrece una buena explicación sobre cómo configurarla. Este enfoque desagregado puede ser especialmente útil si la predicción precisa es más importante que la estimación del efecto de una variable específica.

0voto

Bill Moran Puntos 21

Como la variable de respuesta es categórica, puede considerar las siguientes técnicas de modelización:

1) Logística nominal

2) El bosque de Bootstrap

3) Árbol de decisión

4) Árbol reforzado

5) Red neuronal

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X