5 votos

¿Tiene población, uso de estadística inferencial? Además, no normal variable dependiente, ¿qué hacer?

Antecedentes: Estamos buscando a un permiso parental en Islandia. Estamos particularmente interesados en saber si la crisis económica y los cambios resultantes en el permiso parental legislación afectó el tiempo que toma para que el permiso parental.

Tenemos razones para creer que el efecto de la crisis y de las nuevas leyes serán diferentes para las madres y los padres (que tienen el mismo derecho a un permiso), dependerá de los ingresos y la educación, y que podría haber una interacción entre factores (por ejemplo, que la duración de la licencia para los padres sería independiente de los ingresos antes de las nuevas leyes, pero iba a empezar a depender de los ingresos después de las leyes que fueron aprobadas).

  1. En realidad, tenemos no sólo una muestra, sino a toda la población (alrededor de 50000 niños). Qué necesitamos la estadística inferencial? Puede acabamos de describir los resultados, ya sea de forma numérica o gráfica, porque lo que diferencia hay, que es la diferencia real en la población?

  2. Si necesitamos hacer estadística inferencial, a continuación tenemos algunos problemas potenciales:

    En primer lugar, la variable dependiente (duración de la licencia) no es ni siquiera cerca de una distribución normal. En lugar de eso es multimodal, por ejemplo, es probable que la gente tome 0 días, 30 días, 60 días, 90 días, etc. pero no, por ejemplo, 3 días o 34 días. No puedo transformar esta distribución se parece en nada a como es normalmente distribuida.

Inicialmente se considera el uso de algún tipo de prueba no paramétrica que se ve en las diferencias en las medianas, pero el problema es que las medianas en realidad podría estar siempre cerca de la misma (por ejemplo, 90 días), pero la distribución de los cambios, no obstante.

Yo entonces era considerado binarizing la variable dependiente (por ejemplo, tarda menos que el estándar dejar vs toma estándar de dejar o más). Esto me permitiría utilizar la regresión logística y la rareza de la distribución se ha ido. Yo estoy bien con esto.

Sin embargo, estoy interesado no sólo en los efectos principales (por ejemplo, efecto principal del tiempo y el efecto principal de ingresos), sino también en las interacciones (por ejemplo, la interacción entre el tiempo y los ingresos). No estoy seguro de cómo tratar con las interacciones en la regresión logística, especialmente desde que yo podría tener para el tratamiento de los factores de categorías (por ejemplo, yo no esperaba la duración de la licencia de, digamos, un linealmente aumentar o disminuir con el tiempo, estoy a la espera de una relación curvilínea entre la duración de la licencia y el tiempo).

Qué hacer?

Yo uso principalmente el programa SPSS para el análisis, en caso de que sea relevante.

4voto

AdamSane Puntos 1825

Mientras que usted puede tener una población, la pregunta central es si es realmente a la población sobre la que desea realizar declaraciones (al menos relativos a los efectos en la población y las diferencias). Si no, usted podría todavía en muchos casos tratan como a una muestra. Si es que en realidad la población objetivo, no hay necesidad de inferencia estadística, describen las diferencias.

Con frecuencia, por ejemplo, resulta que el deseo de, por ejemplo, es decir, algo que podría ser relevante en el futuro cercano, o para orientar la política, lo que sugiere un nocional (y tal vez no físicamente realizable) de la población, algo diferente de lo observado. En ese caso no podría decirse que es una razón para continuar con la inferencia estadística.

La variable dependiente en sí no se considera normal en la regresión lineal; el condicional de distribución. Incluso cuando los supuestos son razonables, bimodal/multimodal distribuciones marginales son comunes cuando hay dos o más grupos con diferentes medios.

Usted debe verificar el supuesto de normalidad mediante el examen de los residuos, no la cruda respuesta.

Usted habló acerca de las medianas pero le preocupa que las medianas podría estar cerca, aunque las distribuciones pueden diferir en general. Usted podría considerar la posibilidad de regresión cuantil para un conjunto representativo de cuantiles.

Dichotomizing su respuesta no es generalmente considerado como una buena idea. [Sin embargo, las interacciones (si categórica×categórica, categórica×continuo continuo o×continua) trabajo de la misma manera en la regresión logística como en la regresión lineal; su efecto sobre el predictor lineal, en particular, se entiende casi de la misma manera.]

2voto

Doug Kavendek Puntos 1244

Se escribe "me considera entonces binarizing la variable dependiente (por ejemplo, tarda menos que el estándar dejar vs toma estándar de dejar o más). Esto me permitiría utilizar la regresión logística y la rareza de la distribución se ha ido. Yo estoy bien con esto."

Eso suena como un buen punto de partida. Definitivamente, usted puede incluir interacciones en una regresión logística. Por ejemplo, se podría predecir "tomó una licencia de longitud >= umbral de" uso de indicadores para el ingreso, el género, la educación, un indicador de si estamos en un periodo después de que las nuevas leyes han sido aprobadas, las interacciones de ese indicador con los ingresos, las interacciones de ese indicador con el género... en realidad si se le permite compartir los coeficientes, sería genial si se pudiera ejecutar ese modelo y publicar los resultados aquí.

En lugar de un indicador para saber si la nueva ley ha sido aprobada, usted podría tener un año de los efectos específicos -- y estos podrían ser interactuado con los ingresos, el género, etc si usted tiene suficiente de datos.

Si tiene datos en donde vive la persona, podría ejecutar un jerárquicos de regresión logística en el que tienes ubicación efectos que son modelados como procedentes de algunas común de distribución.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X