sólo lee este hilo de aquí ( ¿Cómo calculo la media de una variable para diferentes grupos controlando la edad, el sexo, la educación...? ) y lo encontró muy útil! En primer lugar, gracias por eso a los autores.
Tengo una pregunta que está relacionada con la pregunta en el hilo de arriba: En un papel Estoy leyendo que se dice:
"Las medias para cada quintil de hogar se estimaron a partir del intercepto de regresión y los coeficientes que controlan para todas las características sociodemográficas (es decir, edad mediana (5 años), mujer, orden de nacimiento mediano (2º), madres con educación primaria, hacinamiento (3,6- 5 personas ⁄ habitación), el entorno rural, y la provincia más representada (Toliary)), y ajustando la agrupación en el hogar y a nivel de la comunidad".
Habiendo leído el post anterior, entiendo que estaban haciendo una regresión y usando la intercepción y el coeficiente como la media estimada.
PERO 1) ¿por qué están usando mediana edad y mediana orden de nacimiento y sólo la provincia más representada en lugar de un conjunto de variables indicadoras de provincia como en las regresiones anteriores?
Y 2) ¿cómo puedo agruparme a nivel de hogar y de comunidad al mismo tiempo?
Aprecio mucho su ayuda, ya que he estado pensando en esas preguntas desde hace tiempo.
¡GRACIAS!
PD: Estoy usando Stata en caso de que esta información sea necesaria.