5 votos

Regresión por orden de rango de la variable dependiente

Estoy buscando un paquete para analizar de rango-orden de los datos en el formulario de regresión. Mi resultado (dependiente) la variable es un orden de rango en el sentido de que los que respondieron a un cuestionario que se les hizo una sola pregunta: para asignar los valores de 1 a 4 para cuatro objetos diferentes (por ejemplo, para clasificar a cuatro coches como el mejor , el segundo mejor, etc). Su primera preferencia fue el número 1, su segundo fue el número 2, etc. Así, para cada encuestado tenemos cuatro observaciones.

Mi primera reacción fue analizar los datos de medidas repetidas de diseño donde he considerado los cuatro rankings como cuatro observaciones para la misma persona (una respuesta por opción). Este sería un caso fácil de regresión ordinal (por ejemplo, proporcional probabilidades modelo) usando la excelente paquete de Frank Harrel (gracias Frank). Sin embargo, estos no son cuatro observaciones independientes por persona, ya que si el demandado se asignan los valores para los tres primeros objetos, entonces el rango de la cuarta objeto está pre-determinado.

¿Alguien sabe si hay un paquete que puede ajustarse a un modelo más apropiado, tal como el Pecado‐Ho Jung y Zhiliang Ying (2003) "Clasificación basada en la regresión con mediciones repetidas de datos", Biometrica, 90 (3), 732-740.

1voto

dotnetengineer Puntos 584

Una persona asigna un valor a los cuatro objetos y el orden de los valores. Si los tres objetos son asignados valores, el valor que se asigna a la cuarta objeto está predeterminado.

Ahora, esto significa que para cada observación, tenemos una permutación de {1,2,3,4}.

Todas las permutaciones posibles son 24 para este conjunto. Cada permutación se puede dar un id. Esta columna id representan a todas las 4 lecturas para esa observación. Ahora, esta columna de id se vuelva a colocar los cuatro columnas en la variable dependiente y podemos retroceder utilizando decir, el modelo logístico. Número de clases será de 24, así que esta cosa va a depender de lo que todas las permutaciones que tiene y el número de observaciones así. Así, dependiendo no. de las observaciones y no. de real permutaciones presente, puede dar "id"s en consecuencia. Ahora, cuando usted predecir la permutación, vamos a la vez conocer la permutación por ejemplo, por la 12, si nos referimos a {2,1,4,3} entonces si predijo la lectura es de 12, vamos a la vez obtener la columna de lecturas.

1voto

Zizzencs Puntos 1358

Me gusta @nikhil 's respuesta. Me gustaría utilizar la orden como el ID, para facilitar la interpretación. Que es 2143 sería el ID de ese rango.

Pero puede ser posible para simplificar. Está usted interesado en la predicción de los 24 combinaciones? Supongamos que Una persona se clasifica el objeto 2134 y la persona B clasifica 2143. ¿A usted le importa? Si sólo se preocupan por lo que está clasificado en primer lugar, usted tiene sólo 4 niveles; sólo la primera y la segunda, de 12 niveles.

SI esto es lo que quiere, que tiene varias ventajas:

  1. Menor tamaño de muestra requerido
  2. Otras estimaciones más precisas
  3. Más fácil interpretación

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X