13 votos

Modelo Tobit explicación

Tenemos 100 participantes en dos grupos, $n=50$ en cada grupo. Se utilizó una evaluación de la capacidad de funcionamiento básico a 4 puntos de tiempo. La evaluación consta de 6 preguntas, cada una con un nivel de 0 – 5. No tenemos resultados individuales para cada pregunta, sólo el total de los puntajes que van de 0 – 30. Las puntuaciones más altas indican un mejor funcionamiento. El problema es que la valoración es muy básica y tiene un significativo efecto de techo. Los resultados son muy negativamente sesgada. La mayoría de los participantes se anotaron cerca de 30 años, especialmente en el 3 tiempo de seguimiento de los puntos de. Es probable que no todos los participantes que puntuaron en los límites superiores son realmente iguales en capacidad de: algunos de los participantes fueron casi con 30 puntos y otros anotó 30 con facilidad y puntuación mucho más alta si es posible y de modo que los datos están censurados desde arriba.

Quiero comparar los dos grupos y a lo largo del tiempo, pero, obviamente, esto es muy difícil dada la naturaleza de los resultados. Transformaciones de cualquier tipo no hacen ninguna diferencia. Se me ha informado de que el modelo Tobit es el mejor equipado para esta evaluación y puedo ejecutar el análisis en R usando ejemplos de Arne Henningen del papel, la Estimación de modelos de regresión censurada en R usando el censReg paquete.

Sin embargo, sólo tengo un conocimiento básico de estadística y he encontrado información sobre el modelo Tobit a ser bastante complicado. Tengo que ser capaz de explicar este modelo en un lenguaje sencillo y no puedo encontrar un lenguaje sencillo, tuercas y los pernos de la explicación de por qué el modelo Tobit realmente hace y cómo. ¿Alguien puede explicar el modelo Tobit o me apunte en la dirección de una lectura de referencia sin necesidad de realizar complicadas estadísticos y matemáticos explicaciones?

Muy agradecido por cualquier ayuda

8voto

alexei.vidmich Puntos 320

La wiki se describe el modelo Tobit de la siguiente manera:

$$y_i = \begin{cases} y_i^* &\text{if} \quad y_i^* > 0 \\ \ 0 &\text{if} \quad y_i^* \le 0 \end{casos}$$

$$y_i^* = \beta x_i + u_i$$

$$u_i \sim N(0,\sigma^2)$$

Voy a adaptar el modelo de arriba con su contexto y de ofrecer un inglés simple interpretación de las ecuaciones que pueden ser útiles.

$$y_i = \begin{cases}\ y_i^* &\text{if} \quad y_i^* \le 30 \\ 30 &\text{if} \quad y_i^* > 30 \end{casos}$$

$$y_i^* = \beta x_i + u_i$$

$$u_i \sim N(0,\sigma^2)$$

En el anterior conjunto de ecuaciones, $y_i^*$ representa una capacidad del sujeto. Por lo tanto, el primer conjunto de ecuaciones de estado las siguientes:

  1. Nuestras mediciones de capacidad de corte en el lado superior a 30 (es decir, se captura el efecto techo). En otras palabras, si la capacidad de una persona es mayor de 30, a continuación, nuestro instrumento de medición no registrar el valor real, pero en lugar de los registros de 30 para esa persona. Tenga en cuenta que el modelo de los estados $y_i = 30 \quad \text{if} \quad y_i^* > 30$.

  2. Por otro lado, si la capacidad de una persona es menor de 30, a continuación, nuestro instrumento de medición es capaz de registrar la medición real. Tenga en cuenta que el modelo de los estados $y_i = y_i^* \quad \text{if} \quad y_i^* \le 30$.

  3. El modelo de la capacidad, $y_i^*$, como una función lineal de nuestro covariables $x_i$ y un término de error asociado a la captura de ruido.

Espero que sea útil. Si algún aspecto no está claro dude en preguntar en los comentarios.

4voto

Ravs Puntos 11

Hay un artículo de Berk en la edición de 1983 de la American Sociological Review (3ª edición) - eso es lo que he aprendido acerca de la censura. La explicación es específicamente sobre el sesgo de selección, pero es absolutamente relevantes para su problema. El sesgo de selección como Berk discute es sólo la censura a través de la muestra proceso de selección, en su caso, la censura es el resultado de un insensible instrumento. Hay algunos lindos gráficos que muestran exactamente cómo usted puede esperar que su línea de regresión parcial cuando Y es censurado en diferentes maneras. En general el artículo es lógico e intuitivo en lugar de matemáticas (sí, me tratan como independiente, prefiriendo el antiguo). Tobit se discute como una solución para el problema.

Más en general, suena como tobit es la herramienta correcta para el trabajo a mano. Básicamente, la forma en que funciona es mediante la estimación de la probabilidad de ser censurado y, a continuación, que incorpora en la ecuación de predicción de la puntuación. Hay otro enfoque propuesto por Heckman el uso de probit y la inversa de mills relación que es básicamente lo mismo, pero le permite tener diferentes variables de predicción de la probabilidad de que la censura y la puntuación en la prueba - es obvio que no sería apropiado para la situación en la que usted tiene.

Otra recomendación - que se podría considerar un jerárquica modelo tobit cuando las observaciones están anidados dentro de los individuos. Esto podría tomar en cuenta correctamente la tendencia de los errores asociados dentro de los individuos. O si no se utiliza un modelo jerárquico, al menos asegúrese de ajustar sus errores estándar para el agrupamiento de las observaciones dentro de los individuos. Sé que todo esto puede ser hecho en Stata y estoy seguro de R con toda su versatilidad también puedo hacerlo.. pero como un ávido Stata usuario no puedo proveer a usted con cualquier orientación acerca de cómo ir sobre él, en R.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X