Antecedentes:
Soy un joven investigador en el instituto de tratar con los problemas regionales, particularmente los relacionados con la política de drogas. Hace casi dos años, uno de nuestros principales investigadores empezaron a recoger la detención de datos sobre cerca de un grande de la ciudad. Él había sido transcribir periódico de la policía de papel secante con la mano hasta que me uní a un año y cambio de atrás y le convenció para cambiar a la recopilación de datos automatizada.
Ahora estamos listos para iniciar el análisis de este conjunto de datos. Contiene alrededor de 20k registros de detención con prácticamente ninguna falta o valores no válidos (me gustaría que se estima que existen menos de 100 de esos registros, y algunos de esos son solo analizador de errores). Estos registros incluyen: nombre completo y domicilio de la persona detenida, el arresto de los oficiales, cargos exactos, etc. (incluso hemos encontrado los números de seguro social en los datos). En este punto, estamos a sólo la exploración de los datos, pero se espera encontrar diferencias en el número y la gravedad de los cargos de acuerdo a la raza, la detención de la ubicación y la ubicación de su domicilio.
Pregunta
El conjunto de datos tiene dos variables que, a mi entender, son categóricos varias de las preguntas de respuesta. "El arresto Oficial" es de dos columnas, una de las cuales tiene siempre un valor y uno de los cuales puede tener un valor (para el segundo oficial presente en el paro). "Los cargos" que es de cinco columnas, cada una con una sola carga, y en ningún orden en particular. Para complicar la estructura más, una persona detenida en más de cinco cargos que se emitirá varios registros.
Hemos metido con el anterior conjunto de datos para un par de horas hasta el momento y han llegado tan lejos como sea capaz de obtener el útil recuentos y porcentajes en el programa SPSS, utilizando la opción de Respuesta de la función de Conjunto y la contramarcha que en Tablas Personalizadas. Este es un buen inicio, pero nos gustaría pasar a un análisis más detallado en algún momento. Por desgracia, ninguno de nosotros somos conscientes de la recomendada (o anti-recomendado) métodos para el análisis de una categoría de múltiples pregunta de respuesta. Esto también se aplica a nuestro deseo, finalmente, el grupo de los cargos específicos (por ejemplo, "la posesión de sustancias controladas < 4 oz.) en categorías más amplias, tales como 'crímenes violentos' o 'los crímenes de drogas'.
Tenga en cuenta que yo no estoy buscando tan sólo un instante respuesta aquí, como no tenemos una fecha límite. Yo estaría encantado de hacer las lecturas, así que siéntase libre para que me señale en la dirección de tutoriales, libros de texto, y así sucesivamente. No soy particularmente vinculado a SPSS - es justo lo que mi compañero de trabajo se utiliza para. Si hay claras desventajas para este tipo de problema, no me importa aprender algo nuevo.