3 votos

Regresión sobre datos agregados

Intento modelar cómo aumentan los salarios a lo largo del tiempo para las diferentes categorías de profesores universitarios, y determinar la naturaleza de la trayectoria de estos aumentos, que difieren entre sí. Estaba planeando una regresión multinivel utilizando el primer nivel como variable temporal, y tres variables categóricas moderadoras en el segundo:

  • x1 = sexo (M/F)
  • x2 = tamaño de la escuela (pequeña, mediana, grande)
  • x3 = rango del profesor (1,2,3)

Por desgracia, los datos con los que tengo que trabajar son bastante desordenados. La mayor parte se presenta de forma agregada (promediada) y no estoy seguro de que un análisis de este tipo sea apropiado. Los tengo:

  • Datos sobre el salario medio de cada categoría
  • Número de escuelas que informan por categoría (diferente para cada categoría y para cada año de informe; n entre 50-100)
  • El valor más bajo/más alto reportado para cada categoría;
  • los percentiles del 25%, 50% y 75% de cada categoría.

En otras palabras, tengo

  • Profesores titulares masculinos en grandes universidades (AY2002), 65 escuelas que informan
  • Salario medio $50000 (Bajo=15000 25%ile=22000 50%ile=49800 75%ile=75000 Alto=100000)

¿Se puede hacer algo con los datos en este formato o estoy condenado? ¿Puedo decir que el salario de los profesores titulares masculinos ha aumentado a un ritmo más rápido o más lento que el de las profesoras auxiliares?

1voto

Chris Puntos 154

Gran pregunta. Desgraciadamente no soy un experto en este campo, pero el reto de analizar datos agregados parece ser un tema de investigación central en estos días. La preocupación general es que las relaciones encontradas en las regresiones con datos agregados pueden no ser válidas en el nivel inferior, como has insinuado.

En definitiva, nunca es seguro confiar en un modelo con datos agregados, pero eso no significa que no se pueda interpretar en algún sentido. Algunas personas sostienen que las técnicas de modelización que se producen al mismo nivel que el proceso teorizado pueden ser "fiables".

Y en algunos casos, los datos agregados no pueden evitarse. Sólo hay que asegurarse de exponer los supuestos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X