Voy a realizar una regresión sobre las puntuaciones totales de los sujetos de las partidas de 2 jugadores (dilema de los prisioneros) que van a jugar. Soy consciente de que incluir las puntuaciones de ambos jugadores de un juego causará problemas debido a la no independencia. ¿Existe alguna manera de solucionar esto, aparte de elegir al azar un sujeto de cada juego para el análisis (y así perder la mitad de los datos)? ¿Hay alguna manera de introducir esto en el modelo, tal vez como un efecto aleatorio?
Respuestas
¿Demasiados anuncios?Supongo que lo que tienes en mente es la puntuación como respuesta y luego algunos atributos del jugador como predictores. Por ejemplo, averiguar si los rubios puntúan más.
¿Por qué no realizar la regresión con el juego como unidad de muestra? Un juego de N puntos debe distribuir esos puntos entre A y B, por lo que puede tomar la puntuación del jugador A para cada juego como una respuesta binomial y luego incluir los atributos de ambos jugadores como predictores.
Tienes un sistema de ecuaciones simultáneas que tratar, del que deberían haber hablado en tu clase de econometría (eres economista, ¿verdad?) Estimarás el sistema utilizando los métodos 2SLS o 3SLS, siempre que tengas una variables exógenas que afectan sólo a uno de los resultados, es decir, a aspectos demográficos como el color del pelo, según la sugerencia de Corone. Habría que imponer restricciones de simetría, para que ambas ecuaciones tengan los mismos coeficientes.
También puede intentar enfocar esto como un problema de análisis de datos diádicos, donde las diadas son, por supuesto, las parejas de jugadores que interactúan. El la literatura existente sobre datos diádicos suele provenir de psicólogos que no se preocupan por la endogeneidad como lo hacen los economistas, por lo que es posible que haya que tomar sus sugerencias con un grano de sal. Modelar los datos diádicos de forma multinivel, es decir, con un efecto aleatorio, es un enfoque popular. Si tiene, por ejemplo, 15 personas y cada una de ellas ha jugado con, digamos, otras 6 personas, entonces tiene problemas adicionales con la falta de independencia en su conjunto de datos, y el modelo multinivel/efecto aleatorio parece aún más apropiado.
Modelar las acciones de los jugadores en lugar de los pagos. Es decir, predecir la probabilidad de que un jugador elija cooperar en una ronda concreta en función de las rondas anteriores (si el juego se repite en su escenario) y de sus covariables. Creo que esto tiene más sentido causal, ya que los jugadores realmente seleccionan las acciones influenciadas por lo que sea, y los pagos son sólo una función determinista de las acciones. Además, esto hace que las variables de salida sean binarias, lo que simplifica el análisis, ya que no hay que pensar en la potencialmente difícil dependencia entre los pagos totales.
Supongo que también está bien tratar las estrategias seleccionadas por cada jugador como condicionalmente independientes dadas las covariables&historia, lo que hace que el análisis sea una simple predicción de una variable binaria. Por otro lado, se podría argumentar que las variables no observadas podrían dar lugar a la dependencia.
Ángel Sanchéz ha aplicado la regresión logística para modelar la probabilidad de cooperar en el dilema del prisionero. Su escenario es probablemente algo diferente, ya que involucra a múltiples jugadores en una red, pero aún así deberías echar un vistazo para ver si su enfoque puede ser modificado para tu escenario.