Tengo los datos de una encuesta que fue (tratado de ser) se administra a todos los niños de los grados particulares en un determinado estado. Yo estoy llegando después de un paso de limpieza a través de la encuesta a los diseñadores que quita obvio no válido respuestas (desde desagradable adolescentes).
Las preguntas a y B tienen binario respuestas, y estoy interesada en los informes de los porcentajes de niños en el 2x2 categorías.
De las aproximadamente 100.000 observaciones que tengo, hay 3.500 que tienen los datos que faltan de a o de B, y no están incluidos en la tabla. Hay decente razón para creer que para estas 2 preguntas, no respuestas no ser particularmente sesgada de una manera o de la otra.
¿Cuál es la forma correcta de prueba/resumen de las diferencias entre las categorías? Es una prueba de chi-cuadrado significativo aquí? Si la falta de respuestas son imparciales, sólo debo de tener una gran muestra aleatoria? O puedo asumir que yo soy sólo un informe de las proporciones reales y estadísticos no es necesaria la prueba?