7 votos

¿Cómo modelar el número de días en el último cigarrillo de la semana (0 a 7 - ' U ' en forma)?

Estoy analizando datos donde la variable de resultado es en forma de ' U'. La variable de resultado se pregunta 'Cuántos de los últimos siete días fumado'. Más respuestas a esta caída en la primera (ninguno) y el último (los siete) categorías. Debido a esto no creo que un modelo de datos de la cuenta es apropiado.

¿Cuál sería un buen enfoque al modelado de esta variable?

1voto

Neal Puntos 316

Es posible que desee echar un vistazo a las dos partes (también conocido como obstáculo) recuento de modelos de datos. Un buen lugar para comenzar es el Capítulo 17 de Cameron y Trivedi Microeconometría el uso de Stata. De hecho, su hábito de fumar ejemplo es el que se usan para motivar a esto. Esencialmente, usted tiene un modelo para determinar si una persona toma de fumar, y luego otro que determina si se deciden a hacerlo.

Otra buena fuente para overdispersed obstáculo datos de recuento es Farbmacher (2011) SJ papel (desplácese hacia abajo para encontrarlo). Sobredispersión sucede cuando el (condicional) de la varianza del resultado supera el (condicional) significa, que a menudo es el caso con este tipo de datos.

0voto

Eric Davis Puntos 1542

Pensar sobre el constructo de interés

Me gustaría pensar sobre el concepto que usted está tratando de medir. Como Macro mencionado, puede ser que la variable es reflejo, en gran medida el hecho de que las personas son fumadores o no fumadores. Si son fumadores, tienden a fumar cada día de la semana, y si no son fumadores, no.

También podría haber una tercera categoría de casual o fumador ocasional. Dicho esto, su único elemento de medida puede no ser la mejor manera de discriminar entre estas tres categorías. Por lo tanto, si usted está interesado en la distinción entre regular y casual fumadores, luego me miraba a la incorporación de algunos otros indicadores de ropa casual de fumar.

Si usted está interesado en la frecuencia o la intensidad del hábito de fumar, su elemento es deficiente en la medición. Usted sería mejor preguntar acerca de la frecuencia media de fumar por día o alguna pregunta similar.

Recomendaciones generales

Por lo tanto, me gustaría considerar a pensar más profundamente acerca de lo que se desea medir. Pero si estás atascado con los datos que usted tiene, usted puede ser que desee hacer uno de un par de cosas diferentes:

  • Recodificar la variable a ninguno o uno o más y predecir mediante regresión logística binaria.
  • Recodificar la variable a ninguno, de uno a seis años, y 7 y predecir mediante la regresión logística multinomial.
  • No recodificación y predecir la variable uso de algo como un probit ordenado o pedido de regresión logística.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X