Al azar de la población de la muestra fue examinada. Se les preguntó si ellos comen una dieta vegetariana. Si respondió que sí, también se les preguntó a especificar el tiempo que he estado comiendo dieta vegetariana sin interrupción. Quiero utilizar estos datos para calcular el promedio de la longitud de adherencia al vegetarianismo. En otras palabras, cuando alguien se convierte en vegetariano, quiero saber cuánto tiempo en promedio se quedan vegetariana. Vamos a suponer que:
- Todos los participantes dieron una correcta y precisa de las respuestas
- El mundo es estable: la popularidad de que el vegetarianismo no es cambiar, el promedio de la longitud de adherencia no está cambiando.
Mi razonamiento tan lejos
He encontrado que es útil para analizar un juguete modelo del mundo, donde al comienzo de cada año, dos personas se convierten en vegetarianos. Cada vez, uno de ellos permanece vegetariana durante 1 año y otro de 3 años. Obviamente, la duración media de la adherencia en este mundo es (1 + 3) / 2 = 2 años. Esta es una gráfica que ilustra el ejemplo. Cada rectángulo representa un período de vegetarianismo:
Digamos que tomamos una encuesta en la mitad del año 4 (línea roja). Obtenemos los siguientes datos:
Nos gustaría obtener los mismos datos, si tomamos la encuesta en cualquier año, a partir del año 3. Si nosotros simplemente el promedio de las respuestas que obtenemos:
(2* 0.5 + 1.5 + 2.5)/4 = 1.25
Nos subestiman porque se supone que todo el mundo dejó de ser vegetarianos a la derecha después de la encuesta, que es obviamente incorrecto. Para obtener una estimación más cercana a la real promedio de veces que estos participantes seguiría siendo vegetariana, podemos asumir que, en promedio, se informó de una hora aproximadamente en la mitad de su período de vegetarianismo y multiplicar informó duraciones por 2. En una gran encuesta de dibujo al azar de la población (como el que yo estoy analizando), creo que esta es una hipótesis realista. Al menos le daría un correcto valor esperado. Sin embargo, si la duplicación es la única cosa que hacemos, obtenemos promedio de 2.5, que es una sobreestimación. Esto es debido a que cuanto más tiempo la persona está vegetariana, la más probable (s)de él es estar en la muestra de la corriente de los vegetarianos.
Pensé entonces que la probabilidad de que alguien está en la muestra de la corriente de los vegetarianos es proporcional a su longitud de vegetarianismo. A cuenta de esta tendencia, traté de dividir el número de vegetarianos por su longitud prevista de la adhesión:
Sin embargo, esto da una incorrecta promedio así:
(2*1 + ½ * 3 + ⅕ * 5)/(2 + ½ + ⅕) = 4 / 2.533333 = 1.579 años
Me gustaría dar la correcta estimación de si el número de vegetarianos fueron divididos por su correcta longitudes de adherencia:
(1 + ⅓ * (1 + 3 + 5))/(1 + ⅓ * 3) = 2 años
Pero no funciona si uso predijo longitudes de adherencia y son todos los que tengo en realidad. No sé qué más probar. He leído un poco sobre el análisis de supervivencia, pero no estoy seguro de cómo se aplica en este caso. Idealmente, también me gustaría ser capaz de calcular un 90% de intervalo de confianza. Cualquier consejo sería muy apreciada.
EDITAR: Es posible que esta pregunta no tiene respuesta. Pero hubo también otro estudio que se preguntó a una muestra aleatoria de la gente si son/eran vegetarianos y cuántas veces lo he sido vegetariano en el pasado. También sé de edad de todo el mundo, tanto en los estudios y algunas otras cosas. Tal vez esta información puede ser usada en conjunto con la encuesta de la actual vegetarianos para obtener la media de alguna manera. En realidad, el estudio que he hablado es sólo una pieza del rompecabezas, pero uno muy importante y quiero sacar más provecho de ella.