Pensar sobre el constructo de interés
Me gustaría pensar sobre el concepto que usted está tratando de medir. Como Macro mencionado, puede ser que la variable es reflejo, en gran medida el hecho de que las personas son fumadores o no fumadores. Si son fumadores, tienden a fumar cada día de la semana, y si no son fumadores, no.
También podría haber una tercera categoría de casual o fumador ocasional. Dicho esto, su único elemento de medida puede no ser la mejor manera de discriminar entre estas tres categorías. Por lo tanto, si usted está interesado en la distinción entre regular y casual fumadores, luego me miraba a la incorporación de algunos otros indicadores de ropa casual de fumar.
Si usted está interesado en la frecuencia o la intensidad del hábito de fumar, su elemento es deficiente en la medición. Usted sería mejor preguntar acerca de la frecuencia media de fumar por día o alguna pregunta similar.
Recomendaciones generales
Por lo tanto, me gustaría considerar a pensar más profundamente acerca de lo que se desea medir. Pero si estás atascado con los datos que usted tiene, usted puede ser que desee hacer uno de un par de cosas diferentes:
- Recodificar la variable a ninguno o uno o más y predecir mediante regresión logística binaria.
- Recodificar la variable a ninguno, de uno a seis años, y 7 y predecir mediante la regresión logística multinomial.
- No recodificación y predecir la variable uso de algo como un probit ordenado o pedido de regresión logística.