22 votos

Variable dependiente continua con ordinal variable independiente

Dada una variable dependiente continua y y variables independientes incluyendo una variable ordinal X1, ¿cómo ajustar un modelo lineal R ? ¿Hay documentos de este tipo de modelo?

33voto

Nick Stauner Puntos 8220

@Scortchi tiene cubierto con esta respuesta en la Codificación de un mundo ordenado covariable. He repetido la recomendación en mi respuesta a Efecto de dos demográfica IVs en las respuestas de la encuesta realizada (escala de Likert). En concreto, la recomendación es utilizar Gertheiss' (2013) ordPens paquete, y para referirse a Gertheiss y Tutz (2009a) para el fondo teórico y un estudio de simulación.

La función específica que probablemente quiera es ordSmooth*. Esto, en esencia, suaviza ficticia de los coeficientes a través de los niveles de las variables ordinales a ser menos diferentes de aquellas para las filas adyacentes, lo que reduce el sobreajuste y mejora de las predicciones. Generalmente se realiza, así como o (a veces mucho) mejor que el de máxima verosimilitud (es decir, de los mínimos cuadrados ordinarios en este caso) la estimación de un modelo de regresión para continuo (o, en sus términos, métrica) de datos cuando los datos son en realidad ordinal. Parece compatible con todo tipo de modelos lineales generalizados, y le permite entrar nominal y continua como predictores independientes de las matrices.

Varias referencias adicionales de Gertheiss, Tutz, y los colegas están disponibles y se enumeran a continuación. Algunos de estos pueden contener alternativas – incluso Gertheiss y Tutz (2009a) discutir ridge reroughing como otra alternativa. No he cavado a través de todo aún a mí mismo, pero baste decir que esto resuelve @Erik problema de muy poca literatura sobre ordinal predictores!

Referencias

- Gertheiss, J. (2013, 14 De Junio). ordPens: Selección y/o el suavizado del ordinal predictores, versión 0.2-1. Recuperado de http://cran.r-project.org/web/packages/ordPens/ordPens.pdf.
- Gertheiss, J., Hogger, S., Oberhauser, C., & Tutz, G. (2011). Selección de forma ordinal escala de las variables independientes con aplicaciones a la clasificación internacional de funcionamiento de los conjuntos básicos. Diario de la Sociedad Real de Estadística: Serie C (Estadística Aplicada), 60(3), 377-395.
- Gertheiss, J., & Tutz, G. (2009a). Penalizado regresión ordinal predictores. Estadística Internacional De Revisión, 77(3), 345-365. Recuperado de http://epub.ub.uni-muenchen.de/2100/1/tr015.pdf.
- Gertheiss, J., & Tutz, G. (2009b). Supervisó la selección de características en espectrometría de masas basado en perfiles proteómicos de blockwise impulsar. La bioinformática, 25(8), 1076-1077.
- Gertheiss, J., & Tutz, G. (2009c). Escala Variable y métodos del vecino más cercano. Diario de Quimiometría, 23(3), 149-151. - Gertheiss, J. & Tutz, G. (2010). Escasa modelado categorial de las variables explicativas. Los Anales de la Estadística Aplicada, 4, 2150-2180.
- Hofner, B., Hothorn, T., Kneib, T., & Schmid, M. (2011). Un marco para el imparcial modelo de selección basado en el fomento de las. Diario de cálculo y Gráficas Estadísticas, 20(4), 956-971. Recuperado de http://epub.ub.uni-muenchen.de/11243/1/TR072.pdf.
- Oelker, M.-R., Gertheiss, J., & Tutz, G. (2012). Regularización y el modelo de selección con categorial predictores y el efecto de los modificadores en los modelos lineales generalizados. Departamento de Estadística: Informes Técnicos, Nº 122. Recuperado de http://epub.ub.uni-muenchen.de/13082/1/tr.gvcm.cat.pdf.
- Oelker, M. R., & Tutz, G. (2013). Una familia general de sanciones por la combinación de diferentes tipos de sanciones generalizada en los modelos estructurados. Departamento de Estadística: Informes Técnicos, Nº 139. Recuperado de http://epub.ub.uni-muenchen.de/17664/1/tr.pirls.pdf.
- Petry, S., Flexeder, C., & Tutz, G. (2011). Pares fusionados lazo. Departamento de Estadística: Informes Técnicos, Nº 102. Recuperado de http://epub.ub.uni-muenchen.de/12164/1/petry_etal_TR102_2011.pdf.
- Rufibach, K. (2010). Un activo algoritmo para la estimación de parámetros en modelos lineales generalizados con ordenó predictores. La Estadística Computacional Y Análisis De Datos, 54(6), 1442-1456. Recuperado de http://arxiv.org/pdf/0902.0240.pdf?origin=publication_detail.
- Tutz, G. (2011, Octubre). Métodos de regularización para datos categóricos. Munich: Ludwig-Maximilians-Universität. Recuperado de http://m.wu.ac.at/it/departments/statmath/resseminar/talktutz.pdf.
- Tutz, G., & Gertheiss, J. (2013). Escalas de calificación como predictores-La vieja cuestión de escala y de algunas respuestas. Psychometrika, 1-20.

17voto

Sam Puntos 101

Cuando hay varios predictores, y el predictor de interés es una variable ordinal, a menudo es difícil decidir cómo el código de la variable. Codificación como categórica pierde la información de la orden, mientras que la codificación como numérico impone linealidad de los efectos de la orden de categorías que pueden estar lejos de sus verdaderos efectos. Para los primeros, isotónica de regresión ha sido propuesto como una forma de lidiar con la falta de monotonía, pero es un modelo basado en datos del procedimiento de selección, que, como muchas otras basadas en datos de los procedimientos, requiere de una cuidadosa evaluación de la final del modelo ajustado y el significado de sus parámetros. Por último, splines puede mitigar parcialmente la rigidez de la linealidad de la asunción, pero las cifras aún deben ser asignados a categorías ordenadas, y los resultados son sensibles a estas opciones. En nuestro papel (Li y Pastor, 2010, Introducción, párrafos 3-5), nos dio una explicación más detallada de estos temas, que son aplicables a todos los modelos de regresión con un ordinal predictor de interés.

Deje $Y$ ser una variable de resultado, $X$ ser el ordinal predictor de interés, y $\bf Z$ ser las otras covariables. Nos hemos propuesto para el ajuste de dos modelos de regresión, uno para $Y$ $\bf Z$ y el otro$X$$\bf Z$, calcular los residuos de los dos modelos, y evaluar la correlación entre los residuos. En Li y Shepherd (2010), hemos estudiado este enfoque al $Y$ es ordinal y demostró que puede ser un muy buen enfoque sólido mientras que el efecto de la $X$ categorías es monótona. Actualmente estamos evaluando el rendimiento de este enfoque en otros resultados tipos.

Este enfoque requiere de un adecuado residual de la regresión ordinal de $X$$\bf Z$. Hemos propuesto un nuevo residual para ordinal resultados en Li y Shepherd (2010) y la utilizó para construir un estadístico de prueba. Hemos estudiado las propiedades y otros usos de este residuo en un documento separado (Li y Pastor, 2012).

Hemos desarrollado un paquete de R, PResiduals, que está disponible de CRAN. El paquete contiene funciones para realizar nuestro enfoque lineal y ordinal resultado de los tipos. Estamos trabajando para agregar otro resultado tipos (por ejemplo, recuento) y características (por ejemplo, permitiendo interacciones medicamentosas). El paquete también contiene funciones para el cálculo de nuestra residual, que es una probabilidad escala residual, para varios modelos de regresión.

Referencias

Li, C. Y Pastor, B. E. (2010). Prueba de asociación entre dos variables ordinales, mientras que el ajuste de covariables. JASA, 105, 612-620.

Li, C. Y Pastor, B. E. (2012). Un nuevo residual para ordinal resultados. Biometrika 99, 473-480.

9voto

unk2 Puntos 36

En general, no hay mucha literatura sobre las variables ordinales como dependiente y poco sobre el uso de ellos como predictores. En la práctica de la estadística son generalmente supone ser continua o categórica. Usted puede comprobar si un modelo lineal con el predictor como una variable continua se ve como un buen ajuste, mediante la comprobación de los residuos.

En ocasiones también se codificaron de forma acumulativa. Un ejemplo sería el de un ordinal de la variable x1 con los niveles 1,2 y 3 para tener una dummy variable binaria d1 para x1>1 y un dummy variable binaria d2 x1>2. A continuación, el coeficiente para la d1 es el efecto que se obtiene al aumentar su número ordinal 2 a 3 y el coeficiente de d2 es el efecto que se obtiene cuando usted ordinal de 2 a 3.

Esto hace que la interpretación sea a menudo más fácilmente, pero es equivalente a usar como una variable categórica para fines prácticos.

Gelman incluso sugiere que uno podría usar el ordinal predictor tanto como un factor categórico (para los efectos principales) y como variable continua (interacciones) para aumentar la flexibilidad de los modelos.

Mi estrategia personal es por lo general para ver si se trata como continua tiene sentido y los resultados en un plazo razonable modelo y sólo los utilizan como categórica si es necesario.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X