Antecedentes: Estamos buscando a un permiso parental en Islandia. Estamos particularmente interesados en saber si la crisis económica y los cambios resultantes en el permiso parental legislación afectó el tiempo que toma para que el permiso parental.
Tenemos razones para creer que el efecto de la crisis y de las nuevas leyes serán diferentes para las madres y los padres (que tienen el mismo derecho a un permiso), dependerá de los ingresos y la educación, y que podría haber una interacción entre factores (por ejemplo, que la duración de la licencia para los padres sería independiente de los ingresos antes de las nuevas leyes, pero iba a empezar a depender de los ingresos después de las leyes que fueron aprobadas).
En realidad, tenemos no sólo una muestra, sino a toda la población (alrededor de 50000 niños). Qué necesitamos la estadística inferencial? Puede acabamos de describir los resultados, ya sea de forma numérica o gráfica, porque lo que diferencia hay, que es la diferencia real en la población?
Si necesitamos hacer estadística inferencial, a continuación tenemos algunos problemas potenciales:
En primer lugar, la variable dependiente (duración de la licencia) no es ni siquiera cerca de una distribución normal. En lugar de eso es multimodal, por ejemplo, es probable que la gente tome 0 días, 30 días, 60 días, 90 días, etc. pero no, por ejemplo, 3 días o 34 días. No puedo transformar esta distribución se parece en nada a como es normalmente distribuida.
Inicialmente se considera el uso de algún tipo de prueba no paramétrica que se ve en las diferencias en las medianas, pero el problema es que las medianas en realidad podría estar siempre cerca de la misma (por ejemplo, 90 días), pero la distribución de los cambios, no obstante.
Yo entonces era considerado binarizing la variable dependiente (por ejemplo, tarda menos que el estándar dejar vs toma estándar de dejar o más). Esto me permitiría utilizar la regresión logística y la rareza de la distribución se ha ido. Yo estoy bien con esto.
Sin embargo, estoy interesado no sólo en los efectos principales (por ejemplo, efecto principal del tiempo y el efecto principal de ingresos), sino también en las interacciones (por ejemplo, la interacción entre el tiempo y los ingresos). No estoy seguro de cómo tratar con las interacciones en la regresión logística, especialmente desde que yo podría tener para el tratamiento de los factores de categorías (por ejemplo, yo no esperaba la duración de la licencia de, digamos, un linealmente aumentar o disminuir con el tiempo, estoy a la espera de una relación curvilínea entre la duración de la licencia y el tiempo).
Qué hacer?
Yo uso principalmente el programa SPSS para el análisis, en caso de que sea relevante.