Estoy analizando los resultados de la encuesta con la mayoría de las respuestas en la forma de escalas Likert. Muchas de estas escalas tienen muy pocos o 0 respuestas en la parte inferior de las categorías. Como se puede imaginar, esto está dando lugar a algunas complicaciones cuando intento ejecutar mis modelos. Todavía estoy obteniendo resultados alentadores, pero quiere estar seguro de que mi información es válida antes de la presentación de informes. A continuación se describe una situación en la que he estado trabajando durante el último par de días:
Estoy utilizando el programa estadístico SPSS para ejecutar una regresión ordinal con dos predictores. En este caso, los predictores de ellos son en realidad las respuestas en una escala de Likert (sino que se introduce en el modelo como variables nominales). Mi DV es, por supuesto, también en una escala ordinal. Mis dos predictores cada uno tiene cinco categorías (niveles de la escala). Mi variable dependiente también tiene 5 niveles. Al igual que con mi predictor de las variables, la variable dependiente tiene muy pocas observaciones en la parte inferior de las categorías. De hecho, cuando ejecuto la regresión, se dice que el 47,5% de las células tienen frecuencias de 0. Sin embargo, todo mi coeficientes son significativos, el general de ajuste del modelo (-2 log likelihood es significativa a .000, y los cocientes de probabilidad (exponentiated forma de mi coeficientes) todos parecen razonables. El modelo se parece a una buena parte de estos celdas con frecuencias de 0.
Mi prueba está fallando la parte proporcional de probabilidades de asunción, que dice que los coeficientes para cada predictor de la categoría debe ser igual en todos los DV niveles. Sé que esto basado en los resultados de la Prueba de líneas Paralelas, que SPSS informes como parte de la regresión ordinal de salida. Así, en la recomendación de un artículo que encontré en internet, me he hecho dos cosas para explorar más a fondo. En primer lugar, me he quedado separado de logística regresiones con nuevas variables dependientes, cada uno representando a un caso en mi original DV - en otras palabras, se indican Y si es menor que cada uno de mis originales DV categorías (excepto el inferior). Así que mi nueva DV son de nivel 2 o superior vs no; nivel 3 o superior vs no; etc.. Estos no producen relaciones significativas para la mayoría de los IV-DV combinaciones (las células). La idea es comparar las probabilidades de ocurrencia a través de los diferentes puntos de corte para ver si están bastante constante. En mi caso, ya que pocos son importantes, no lo son.
La segunda cosa que he hecho es estimado por separado ordinal regresiones utilizando mi original de la variable dependiente - hice un modelo para cada categoría en mi predictores, codificado como maniquíes. Así, en 10 modelos diferentes (2 variables predictoras con 5 categorías, cada una), mi único predictor sería: 1 para el nivel 2 y un 0 para todos los otros niveles; o un 1 para el nivel 3 y un 0 para todos los otros niveles; etc.. Para la mayoría de estas categorías, las líneas paralelas es un error (es decir, el valor null que el proporcional de probabilidades suposición se confirmó es demostrar la verdad – una buena cosa). Sin embargo, en un par de estas categorías, no tengo observaciones (nadie respondió Muy Pobres o Pobres en uno de mis predictor escalas Likert). Por lo tanto no puedo conseguir una línea paralela P-valor para estas categorías.
Mi pregunta tiene dos partes.
Una de ellas es si es la parte inferior de los niveles de las variables predictoras que están causando las líneas paralelas de la prueba a fallar... y si la razón es que no existen observaciones en estas categorías, si todavía puedo utilizar el general impares del ratios de mi modelo completo. Creo que esto no debería ser un problema, ya que estas categorías de forma automática caída de la modelo.
La segunda pregunta es si, en cambio, podría ser la baja/0 frecuencias en la parte inferior de mi DV que está causando las líneas paralelas de la prueba a fallar. Yo no creo que se basa en el hecho de que la prueba se pasa para todos predictor de la variable categorías que tienen observaciones en ellos. He tratado de combinar la parte inferior de las categorías de mi DV, y esto disminuye el % de células con frecuencias de 0, pero no elimina totalmente el problema.
Muchas gracias por tomar el tiempo para considerar mi pregunta. Yo estaría tremendamente agradecido por cualquier orientación que usted puede proporcionar.