4 votos

¿Hay un Chi en un dato de población (casi) completa?

Tengo los datos de una encuesta que fue (tratado de ser) se administra a todos los niños de los grados particulares en un determinado estado. Yo estoy llegando después de un paso de limpieza a través de la encuesta a los diseñadores que quita obvio no válido respuestas (desde desagradable adolescentes).

Las preguntas a y B tienen binario respuestas, y estoy interesada en los informes de los porcentajes de niños en el 2x2 categorías.

De las aproximadamente 100.000 observaciones que tengo, hay 3.500 que tienen los datos que faltan de a o de B, y no están incluidos en la tabla. Hay decente razón para creer que para estas 2 preguntas, no respuestas no ser particularmente sesgada de una manera o de la otra.

¿Cuál es la forma correcta de prueba/resumen de las diferencias entre las categorías? Es una prueba de chi-cuadrado significativo aquí? Si la falta de respuestas son imparciales, sólo debo de tener una gran muestra aleatoria? O puedo asumir que yo soy sólo un informe de las proporciones reales y estadísticos no es necesaria la prueba?

4voto

Ted Puntos 854

La respuesta es "depende".

Algunos de debate en esta cuestión y aquí y aquí. Básicamente, si usted está interesado sólo en la descripción de esta población en particular, usted podría reporte de sus proporciones (posiblemente después de la imputación de los valores para los niños que no tienen) y hacer con ella. Algunas dura insisten en que no hay inferencia estadística (aparte de la imputación) y cuando tenga todos los datos.

Sin embargo, si usted desea responder a una pregunta que no se trata de una real finito de la población, pero los datos de generación de proceso que produjo la población, entonces es a menudo sensible para el tratamiento de la "población" como si se trata de una muestra de un conjunto infinito generado por el proceso. A menudo estas preguntas serán las de la mayoría de los teóricos o de las políticas de interés. Esto significa que usted puede hacer todas las "habituales" de inferencia incluyendo Chi-cuadrado de estadísticas en este caso.

Yo personalmente soy de la opinión de que para muchos propósitos es muy útil para poder saber si la relación observada en la población real se hayan generado a través de chance o no. Por ejemplo, podemos estar interesados en semi-hipotética de las poblaciones de otros estados o de los tiempos - que son importantes, pero muy difícil de caracterizar exactamente. Teniendo en cuenta el hyper-la población de la población en la que, en realidad, puede ser un buen punto de partida.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X