A mí esta pregunta está fuera de la esfera de cualquier norma econométrico, el libro de texto de respuesta o solución. Puedo ver varios enfoques para abordar la cuestión, pero no una "correcta" o "mejor" solución.
Personalmente, me gusta el modelo de datos de panel con OLS estimación de la estructura. Tiene sentido, especialmente respecto de la agrupación de la relativamente escasa información disponible para las mujeres de los directores Ejecutivos. Por no hablar de que este enfoque tiene una larga y venerable historia en la elaboración de modelos econométricos de desempeño de las empresas. Acaba de dar cuenta de las transformaciones de la variable dependiente(s) a fin de garantizar que la escala invariante, según corresponda. Una pregunta clave es si se usa un ANOVA o modelo mixto (jerárquica) de forma funcional. El último enfoque es motivado por el hecho de que las empresas se pueden anidar dentro de los códigos de SIC, formando una estructura jerárquica. Se ha demostrado que esta clase de modelos se reduce la varianza considerablemente vs no-jerárquica de ANOVA.
Usted no ha declarado lo que sus métricas de rendimiento. Esto parece como una pieza de información útil para saber. Muchas de las métricas de sugerir a sí mismos como el precio de la acción (o su logaritmo natural), año-sobre-año, % de rentabilidad, capitalización de mercado, rendimiento total para los accionistas (también conocido como EVA o valor económico añadido), etc. Me gustaría tener un tiempo difícil escoger sólo uno. De hecho, mi opinión es que, ¿por qué desea elegir solo uno cuando MANOVA-tipo de marcos están disponibles y son potencialmente muy perspicaz? Me gustaría aprovechar una combinación de variables dependientes, incluyendo relativo (% de retorno, TRS, etc.) con absoluta (precio de las acciones, la capitalización de mercado, etc.) medidas para evaluar cómo los conductores de desempeño de evolucionar en función del tipo de medida objeto de análisis.
Un Bayesiano como Andrew Gelman, en su libro con Jennifer Hill el Análisis de los Datos Mediante Regresión Multinivel y/Modelos Jerárquicos (cap. 13), afirmaría que un tamaño de muestra de 1 sigue analizable, al menos en términos de la parte posterior de la información producida por Bayesiano de modelos. La adopción de este marco podría hacer que la dispersión de la mujer CEO de la información más manejable.
En términos de una de las pruebas que desea realizar:
En la segunda parte de mi análisis, estoy tratando de corregir
potencial endogeneidad de los problemas, y tratar de ver si hay un reverso
la causalidad, lo que significa que la hembra CEOs realmente mejorar el rendimiento de
la empresa, O hacer que seleccionan a sí mismos en un mejor desempeño de las empresas o
mejoras en el rendimiento de las empresas tienen más flexibilidad para nombrar a una mujer como
El CEO.
Un problema inmediato con esta hipótesis como se indica es que usted no ha indicado cómo se va a medir la firma de "flexibilidad". En otras palabras, es una gran pregunta, pero ¿cómo es la "flexibilidad" que se operacionalizan? Comparativa de los resultados de las empresas es una de las más fácilmente comprobables hipótesis centrándose en el rendimiento antes y después de que una mujer CEO es introducido.
La endogeneidad es una cuestión especialmente dura para la dirección, e incluso los más hardcore econométrico de modeladores admitir que el uso de IVs presenta tantos problemas como los que resuelve, es decir, la cura puede ser peor que la enfermedad. Entre las recomendaciones de "soluciones" es 2SLS. Wooldridge, en su libro Análisis Econométrico de la Sección Transversal y Datos de Panel dedica varias secciones para esta discusión. Mi problema con este libro es que es de un teórico de la perspectiva, es decir, sus ejemplos están basados en el "juguete" de datos donde las matrices de entrada son ordenada, equilibrada y observados, es decir, que él no tiene que lidiar con la falta de valores, desequilibrada matrices wrt tiempo y tamaño de la muestra, censurar o cualquier otra irregularidad. Esto rara vez es la realidad en los trabajos aplicados y no es ciertamente el caso con su información.
Dado que la endogeneidad es principalmente un problema teórico, el analista es casi obligado el uso de la teoría a la unidad de una solución. Empíricamente, esto hace que sea casi insoluble, indeterminado problema. No había leído nada en la empresa en el modelado de la literatura que aborda este reto, me gustaría hacer una analogía a la "edad-periodo-cohorte" modelos donde la aspiración es la de separar los efectos por separado para cada factor independiente de los otros dos. Estos son problemas en campos tales como geriátrica envejecimiento, la sociología, el marketing o la ciencia política, que requiere bastante tiempo, fotogramas incluso para inicializar los modelos. (Nota de la edad se refiere a la edad cronológica de una unidad, periodo , se refiere a una época o de un conjunto de años cronológicos, por ejemplo, el 60 o 90 años y cohorte se refiere a un grupo que generalmente se basa en el año de nacimiento, por ejemplo, la generación y o los baby boomers). Indeterminancy es inherente a la estructura de modelo. Por ejemplo, estadístico y científico de la política, Andrew Gelman ha escrito en un documento no publicado, Pensamientos sobre la nueva procedimientos estadísticos para la edad-periodo-cohorte de análisis, (aquí ... http://www.stat.columbia.edu/~gelman/investigación/inédito/apc.pdf), "no puede haber una solución general para la edad-periodo-cohorte problema". Luego continúa diciendo que, "Algunos de los métodos de restringir el espacio de soluciones que parecen más razonables que otros," pero ofrece poco más allá de la intuición y el sentido común como criterio de selección.
En su caso, la relativa inmediatez de la hembra CEOs que complica aún más el problema. Este es un tipo de censura que, potencialmente, argumenta para tratar el problema como un modelo de supervivencia. Otro enfoque podría ser de tratarla como una discontinuidad en la regresión modelo donde las empresas con al menos una mujer CEO son su grupo de tratamiento y las empresas nunca tener a una mujer como CEO del grupo de control. El efecto de modelado es el rendimiento antes y después de la introducción, por el colapso o el promedio de la modelo-tiempo previsto de la serie, después de controlar por otros factores, por supuesto, la creación de un ocho el diseño de la célula (pre vs post, tratamiento vs control, masculino frente al femenino).
Algunas interacciones sugieren ellos mismos. La mayoría de los stat paquetes ofrecen una variedad de suma de cuadrados de las métricas en el ANOVA de los modelos de tipo, tales como el jerárquico o de efectos independientes, que pueden ser utilizados en la determinación de la importancia relativa de las variables en el modelo. Ulrike Groemping tiene papeles y una R (módulo de RELAIMPO) que la revisión de la heurística sugerido en la literatura relativa de importancia variable. Su enfoque en su R es el módulo para aprovechar los ANOVA de efectos de tipo en un computacionalmente intensivo manera de desentrañar el promedio general de la variable de efectos bajo diferentes especificaciones de los modelos. Sus cosas, es digno de una mirada.
De todos modos, estos son sólo un par de pensamientos. Como ya se ha señalado, una sola respuesta a sus preguntas, no será suficiente.
/** Más Tarde, Pensamientos **/
Usted ha hablado de "causalidad inversa." A mí, que sugiere un interés en la determinación de plomo-lag estructuras sin un a priori de la teoría sobre la dirección de la estructura causal. Este papel por Sornette sugiere un test no paramétrico de acercamiento a la comprensión de retraso estructuras en las que la flecha de tiempo se trata agnostically. No paramétrico de la Determinación en Tiempo Real de Lag Estructura entre Dos Series de Tiempo: la "Térmica Óptima Causal de" Ruta de Método, Sornette y Zhou.
https://arxiv.org/pdf/cond-mat/0408166.pdf