5 votos

Análisis de "Respuesta múltiple" de los registros de detención

Antecedentes:

Soy un joven investigador en el instituto de tratar con los problemas regionales, particularmente los relacionados con la política de drogas. Hace casi dos años, uno de nuestros principales investigadores empezaron a recoger la detención de datos sobre cerca de un grande de la ciudad. Él había sido transcribir periódico de la policía de papel secante con la mano hasta que me uní a un año y cambio de atrás y le convenció para cambiar a la recopilación de datos automatizada.

Ahora estamos listos para iniciar el análisis de este conjunto de datos. Contiene alrededor de 20k registros de detención con prácticamente ninguna falta o valores no válidos (me gustaría que se estima que existen menos de 100 de esos registros, y algunos de esos son solo analizador de errores). Estos registros incluyen: nombre completo y domicilio de la persona detenida, el arresto de los oficiales, cargos exactos, etc. (incluso hemos encontrado los números de seguro social en los datos). En este punto, estamos a sólo la exploración de los datos, pero se espera encontrar diferencias en el número y la gravedad de los cargos de acuerdo a la raza, la detención de la ubicación y la ubicación de su domicilio.

Pregunta

El conjunto de datos tiene dos variables que, a mi entender, son categóricos varias de las preguntas de respuesta. "El arresto Oficial" es de dos columnas, una de las cuales tiene siempre un valor y uno de los cuales puede tener un valor (para el segundo oficial presente en el paro). "Los cargos" que es de cinco columnas, cada una con una sola carga, y en ningún orden en particular. Para complicar la estructura más, una persona detenida en más de cinco cargos que se emitirá varios registros.

Hemos metido con el anterior conjunto de datos para un par de horas hasta el momento y han llegado tan lejos como sea capaz de obtener el útil recuentos y porcentajes en el programa SPSS, utilizando la opción de Respuesta de la función de Conjunto y la contramarcha que en Tablas Personalizadas. Este es un buen inicio, pero nos gustaría pasar a un análisis más detallado en algún momento. Por desgracia, ninguno de nosotros somos conscientes de la recomendada (o anti-recomendado) métodos para el análisis de una categoría de múltiples pregunta de respuesta. Esto también se aplica a nuestro deseo, finalmente, el grupo de los cargos específicos (por ejemplo, "la posesión de sustancias controladas < 4 oz.) en categorías más amplias, tales como 'crímenes violentos' o 'los crímenes de drogas'.

Tenga en cuenta que yo no estoy buscando tan sólo un instante respuesta aquí, como no tenemos una fecha límite. Yo estaría encantado de hacer las lecturas, así que siéntase libre para que me señale en la dirección de tutoriales, libros de texto, y así sucesivamente. No soy particularmente vinculado a SPSS - es justo lo que mi compañero de trabajo se utiliza para. Si hay claras desventajas para este tipo de problema, no me importa aprender algo nuevo.

4voto

Judioo Puntos 625

Yo no puedo particularmente comentario sobre cómo manejar múltiples categorías de respuesta, pero usted necesita para perfeccionar su pregunta para la gente en este foro para ser capaz de dar consejos útiles.

Usted menciona diversos intereses, tales como algún tipo de política de drogas de la intervención, y el diferencial de los cargos de acuerdo a la raza, la detención de la ubicación y la ubicación de su domicilio. Para el diferencial de sus cargos es un enorme cuerpo de criminológicas de la literatura que evalúan diversos aspectos de este. Está usted interesado en el comportamiento discrecional de particular a los oficiales (o prejuicios raciales tratamiento)? Está usted interesado en los aspectos desproporcionado de la minoría de contacto con el sistema de justicia penal? Hay una amplia variedad de posibles preguntas que no puedo dar ningún consejo. De qué naturaleza es la política de drogas de la intervención? Está usted interesado en los antecedentes penales y el efecto de algunas políticas?

La naturaleza de los datos es bastante típico. Algunos reciente arresto de datos trabajé con un promedio de alrededor de 3 cargos por detención (recuerdo 1 caso de tener 20 cargos en un solo arresto). Normalmente, usted tendrá algunos cargos que tienden a venir juntos (y algunas veces funcionalmente redundantes cargos). A menudo los tiempos de cargos de posesión de drogas no están solos porque el delincuente no hizo otra cosa que atraer a los oficiales de la atención (más a menudo otro delito), y el momento de la detención que se buscaron y se encontraron drogas. Sin duda, tienen un núcleo de delincuentes prolíficos en sus datos, y para cualquier análisis que se quiera saber sus historias, y probablemente les tomará en cuenta para su análisis (¿tienen identificadores únicos para los individuos o usted tiene que coincidir con base en los nombres, DOBs, y/o número de seguro social?) Usted también puede tener co-ofender a un comportamiento que pueda ser de su interés.

La mayoría de los proyectos en los que han estado involucrados (incluyendo a mi propio trabajo) han tratado las múltiples cargos en dos maneras. Solo se incluyen los "top" del cargo de acuerdo a algunos criterios de clasificación, la otra es solo analizar un subconjunto particular de los cargos. Este es apenas consejo universal, sin embargo, y sin saber la pregunta que se está abordando es probable que no sea aconsejable para hacer cualquiera de estos en el inicio. Si usted mata de cualquiera de los cargos juntos (por ejemplo, el tratamiento de la posesión de malezas de la misma como la posesión de la cocaína), le sugiero que hacerlo en el terreno teórico como oposición al uso de algún tipo de métodos estadísticos (aunque, de nuevo dependiendo de la pregunta de algún tipo de stat método de agrupación puede ser útil).

Las preguntas más específicas que usted tenga la mejor de esta comunidad será capaz de dar un consejo. La naturaleza de los datos puede parecer complicado, pero muchas personas en este foro que han tenido experiencia con estructuras de datos similares (al menos en varios aspectos).

2voto

Omar Kooheji Puntos 384

He examinado las asociaciones entre múltiples respuesta catgeogrical variables en el pasado, básicamente siguiendo el log-lineal de enfoque para la marginal de los datos descritos en el siguiente:

Su caso puede ser más complicado, ya que estás mirando más que Oficial de los Cargos. Pero el Bilder papel y referencias puede ser un buen comienzo para explorar sus opciones de modelado. Lo bueno es que yo era capaz de encajar esto en R sin mucho problema.

El problema es probable que se ejecuten en es acabar con un escaso tabla de contingencia que puede conducir a problemas de convergencia cuando la colocación de los log-lineal de la modelo. En este sentido, creo que de Andy y Srikant consejo te servirá bien-tendrás que hacer algunas suposiciones y simplificaciones adecuadas para su dominio. Averiguar cuál es la pregunta que le interesa y ver si usted puede reducir las dimensiones de alguna manera.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X