Dadas estas categorías como datos fuera de mi control, codificaría
1 No
2 Sometimes
3 Yes
4 Don't know
por estos motivos:
-
A veces suena más débil que Yes, que es más enfático.
-
No sé no suele formar parte de una secuencia ordenada.
Entonces, algunos análisis exigirán ignorar el 4 y otros no. Todo depende de la pregunta que se formule: por ejemplo, ¿estás describiendo los datos o modelizando?
Pero creo que es un error decir que "no lo sé" falta. Todos respondemos también a cuestionarios. Si se me permite decir "No lo sé" como una de varias respuestas posibles, eso no equivale en absoluto a que me niegue o decline responder a la pregunta. Como participante ocasional en encuestas y como estadístico, me opongo a que se analicen así los datos.
No hay motivos para llamar continua a esta variable. Es discreta. Sólo de 1 a 3 está ordenada, de 1 a 4 es sólo nominal o desordenada.
Un contexto de regresión logística no cambia la forma de pensar sobre la variable, a menos que se esté considerando como respuesta y se esté eligiendo entre logística ordinal y multinomial.
EDITAR
Pensando un poco más en esto, es difícil ver que "A veces" y "Sí" se excluyan mutuamente. ¿Cuáles son las preguntas? ¿Alguna vez comes carne, bebes alcohol, fumas tabaco?
Existe otro problema si a la gente se le presentan estas respuestas en este orden:
1- No
2- Do not know
3- Sometimes
4- Yes
Entonces es perfectamente posible que, racionalmente o no, algunas personas lo consideren una escala ordenada. Por ejemplo: "¿Aprueba el comportamiento de destacado político ?". Hay razones para decir que "No lo sé" está entre los extremos, como en "No sé lo suficiente o no quiero juzgar el tema". Pero entonces se espera que la gente conozca la diferencia entre "No sé" y "A veces". Eso puede ocurrir: Yo no tenía ni idea de lo que implicaba una afección médica menor hasta que me ocurrió y me la nombraron y explicaron.
Sin pruebas cualitativas sobre cómo se recibió o entendió el cuestionario, es muy difícil hacer algo más que especular.
0 votos
¿Cuántos datos tienes?
0 votos
Se trata de un modelo de regresión para 2 muestras distintas, cada una de ellas con unos 80 datos de encuestados
1 votos
Considerar una ordinal modelo de respuesta ...
0 votos
El orden de las respuestas no importa realmente para mi objetivo, he pensado que debería codificarse como una variable categórica en una regresión binaria para poder ver el efecto de cada nivel, pero agradezco su sugerencia. ¿Por casualidad tiene alguna idea de cómo interpretar un valor constante negativo en un modelo de regresión binaria?
0 votos
Una constante negativa para una categoría significa que la predicción es menor que la de la categoría del nivel base. La cantidad variará dada la función de enlace logit.
0 votos
Este cuestionario tiene aspectos mixtos ordinales y categóricos. La respuesta "no sabe" no está ordenada unívocamente entre no-a veces-sí. Si quiere deshacerse de estos aspectos, debería responder a preguntas anidadas. Por ejemplo, pregunte primero "¿ha pedido alguna vez antibióticos sin receta?" antes de preguntar "¿ha recibido alguna vez antibióticos sin receta?". Entonces podrá deshacerse de la opción "no sabe" y utilizar la respuesta como variable ordinal. En la forma actual sólo se puede utilizar la pregunta como variable categórica (y hay que tener en cuenta que la forma en que se formuló crea confusión).