14 votos

¿Sesgo en la selección del jurado?

Un amigo es representar a un cliente en el recurso de apelación, después de un juicio penal en el que aparece que la selección del jurado fue por motivos raciales.

El jurado estuvo compuesta de 30 personas, en 4 grupos raciales. La fiscalía utiliza las recusaciones sin causa para la eliminación de 10 de estas personas de la piscina. El número de personas y número de desafíos en cada grupo racial fueron, respectivamente:

A: 10, 1
B: 10, 4
C:  6, 4
D:  4, 1
total: 30 in pool, 10 challenges

El acusado fue racial y el grupo C y las víctimas de los grupos raciales a y D, por lo que la preocupación de un a priori es la de si el grupo C es más de un desafío y a los grupos a y D en un desafío. Legalmente (IIUC; IANAL), la defensa no necesita demostrar los prejuicios raciales, sino simplemente para mostrar que los datos parecen indicar un sesgo, que luego se pone la carga sobre la fiscalía para explicar cada reto no racial.

Es el siguiente análisis correcto en su enfoque? (Creo que los cálculos están bien.):

Hay nCr(30,10) = 30,045,015 distintos conjuntos de 10 miembros del consorcio. De estos conjuntos distintos, me cuentan que 433,377 conjuntos de los dos (no más de 2 de los miembros del grupo a y D combinado) y (no menos de 4 miembros del grupo C).

Por lo tanto la posibilidad de alcanzar el nivel observado de aparente sesgo favoreciendo a los grupos a y D en el grupo C (donde favoreciendo medios no incluidos en el conjunto de los 10 retos) sería la relación de estos, 433/30045 = 1.44%.

Por lo tanto la hipótesis nula (sesgo) se rechaza al 5% de nivel de significación.

Si este análisis es metodológicamente correcto, ¿cuál sería la más sucinta manera de describir a un tribunal, incluyendo un académico / profesional de referencia (es decir, no Wikipedia)? Mientras que el argumento parece sencillo, ¿cómo puede uno más clara y sucintamente demostrar a la corte que es correcto, no chanchullos?


Actualización: Esta cuestión fue objeto de consideración como un tercer argumento en una apelación. Dada la complejidad técnica (desde el punto de vista del abogado) de la discusión y de la aparente falta de precedentes legales, el abogado ha optado por no aumentar, por lo que en este punto la pregunta es principalmente teórico / educativo.

Para responder a un detalle: creo que el número de desafíos, 10, fue establecido de antemano.

Después de estudiar el reflexivo y desafiante respuestas y comentarios (gracias a todos!), parece que hay 4 temas separados aquí. Para mí, al menos, sería más útil considerar por separado (o para escuchar los argumentos de por qué no son separables.)

1) Es la consideración de las carreras de ambos acusado y las víctimas, en el jurado de los desafíos, de preocupación legal a priori? El objetivo de la apelación argumento podría ser, simplemente, para plantear una preocupación razonable, lo que podría conducir a una orden judicial que la fiscalía de estado de la razón individual para cada desafío. Esto no me parecen de un estadístico de la pregunta, sino más bien social / legal, que es el abogado de la discreción para subir o no.

2) Suponiendo (1), es mi elección de una hipótesis alternativa (cualitativamente: el sesgo en contra de los miembros del jurado que comparten el acusado de la carrera, en favor de aquellos que comparten las víctimas carreras) plausible, o es demasiado post hoc? Desde mi perspectiva de los laicos, esta es la más desconcertante pregunta-sí, por supuesto que no iba a subir si no la observan! El problema, como yo lo entiendo, es el sesgo de selección: pruebas debe considerar no sólo el jurado de la piscina, pero el universo de todas las piscinas del jurado, incluyendo todos aquellos en los que la defensa no se observa una discrepancia y, por tanto, no fueron tentados a plantear el tema. ¿Cómo se trata esto? (Por ejemplo, ¿cómo Andy prueba frente a este?) Parece que, aunque puedo estar equivocado acerca de esto, que la mayoría de los encuestados no están preocupados por potencialmente post-hoc de 1 cola pruebas de sesgo únicamente contra el acusado del grupo. ¿Cómo sería metodológicamente diferentes simultáneamente la prueba de la parcialidad de los grupos de víctimas, asumiendo (1)?

3) Si uno se estipula en la elección de mi cualitativa hipótesis alternativa como se indica en (2), entonces, ¿qué es una estadística para la prueba? Esto es donde estoy más desconcertado por las respuestas, porque la relación que propongo parece ser un poco más conservador analógico de Andy prueba para el simple "sesgo en contra de la C" hipótesis alternativa (más conservador porque mi prueba también cuenta todos los casos en la cola, no sólo la exacta observó el conde.)

Ambas pruebas son sencillas de recuento de pruebas, con el mismo denominador (el mismo universo de muestras), y con numeradores correspondiente precisamente a la frecuencia de esas muestras que corresponden a las respectivas hipótesis alternativas. Así que @whuber, ¿por qué no es idénticamente como verdad de mi recuento de la prueba como de Andy que se "puede estar basada en estipulados null [mismo] y alternativa [como se describe] hipótesis y justificar usando el lema de Neyman-Pearson"?

4) Si uno se estipula (2) y (3), hay referencias en el caso de la ley de convencer a un escéptico de la corte de apelaciones? A partir de la evidencia hasta la fecha, probablemente no. También, en esta etapa de la apelación no hay oportunidad para que cualquier "testigo experto", por lo que las referencias lo son todo.

7voto

Neal Puntos 316

He aquí cómo yo podría enfoque para responder a tu pregunta utilizando el estándar de herramientas estadísticas.

A continuación presentamos los resultados de un análisis probit de la probabilidad de ser rechazado dado que el miembro del jurado de la pertenencia a un grupo.

Primero, aquí está lo que los datos parecen. Tengo 30 observaciones de grupo y un binario rechazado indicador:

. tab group rejected 

           |       rejected
     group |         0          1 |     Total
-----------+----------------------+----------
         A |         9          1 |        10 
         B |         6          4 |        10 
         C |         2          4 |         6 
         D |         3          1 |         4 
-----------+----------------------+----------
     Total |        20         10 |        30 

Aquí están las individuales de los efectos marginales, así como la articulación de la prueba:

. qui probit rejected ib2.group

. margins rb2.group

Contrasts of adjusted predictions
Model VCE    : OIM

Expression   : Pr(rejected), predict()

------------------------------------------------
             |         df        chi2     P>chi2
-------------+----------------------------------
       group |
   (A vs B)  |          1        2.73     0.0986
   (C vs B)  |          1        1.17     0.2804
   (D vs B)  |          1        0.32     0.5731
      Joint  |          3        8.12     0.0436
------------------------------------------------

--------------------------------------------------------------
             |            Delta-method
             |   Contrast   Std. Err.     [95% Conf. Interval]
-------------+------------------------------------------------
       group |
   (A vs B)  |        -.3    .181659     -.6560451    .0560451
   (C vs B)  |   .2666667   .2470567     -.2175557     .750889
   (D vs B)  |       -.15   .2662236     -.6717886    .3717886
--------------------------------------------------------------

Aquí estamos probando el individuo hipótesis de que las diferencias en la probabilidad de ser rechazado por los grupos a, C, y D en comparación con el grupo B son cero. Si todo el mundo fuera como pueden ser rechazados como grupo B, estos serían cero. La última pieza de la salida nos dice que el grupo a y D los miembros del jurado tienen menos probabilidades de ser rechazado, mientras que el grupo C de los miembros del jurado son más propensos a ser rechazado. Estas diferencias no son estadísticamente significativas individualmente, a pesar de los signos de acuerdo con el sesgo de la conjetura.

Sin embargo, podemos rechazar la articulación hipótesis de que los tres diferencias son todos cero en $p=0.0436$.


Addendum:

Si puedo combinar los grupos a y D en uno, ya que comparten las víctimas, las carreras, el probit de los resultados es más fuerte y tiene una buena simetría:

Contrasts of adjusted predictions
Model VCE    : OIM

Expression   : Pr(rejected), predict()

------------------------------------------------
             |         df        chi2     P>chi2
-------------+----------------------------------
      group2 |
 (A+D vs B)  |          1        2.02     0.1553
   (C vs B)  |          1        1.17     0.2804
      Joint  |          2        6.79     0.0336
------------------------------------------------

--------------------------------------------------------------
             |            Delta-method
             |   Contrast   Std. Err.     [95% Conf. Interval]
-------------+------------------------------------------------
      group2 |
 (A+D vs B)  |  -.2571429   .1809595      -.611817    .0975313
   (C vs B)  |   .2666667   .2470568     -.2175557     .750889
--------------------------------------------------------------

Esto también permite exacta de Fisher para dar congruencia de los resultados (aunque todavía no en el 5%):

 RECODE of |       rejected
     group |         0          1 |     Total
-----------+----------------------+----------
       A+D |        12          2 |        14 
         B |         6          4 |        10 
         C |         2          4 |         6 
-----------+----------------------+----------
     Total |        20         10 |        30 

          Pearson chi2(2) =   5.4857   Pr = 0.064
           Fisher's exact =                 0.060

3voto

Judioo Puntos 625

Me hicieron una pregunta similar anteriormente (para la referencia aquí es el caso particular de discutir). Las necesidades de la defensa mostrar simplemente una prima salpicadero caso de discriminación en Batson desafíos (asumiendo Estados Unidos el derecho penal), por lo que las pruebas de hipótesis son, probablemente, una mayor carga de la que se necesita.

Así, por:

  • $n = 30$ de la gente en el panel de venire
  • $p = 6$ de las personas de la clase C en el panel
  • $k = 4$ de los miembros del jurado de grupo racial C eliminado en imperativa desafíos
  • $d = 10$ imperativa desafíos

Whuber la respuesta anterior da la probabilidad de este resultado en particular que se dicte por la distribución hipergeométrica:

$$\frac{{p \choose k} {n-p \choose d-k} }{{n \choose d}}$$

Que Wolfram-Alpha dice que es igual en este caso:

$$\frac{{6 \choose 4} {30-6 \choose 10-4} }{{30 \choose 10}} = \frac{76}{1131} \approx 0.07$$

Lamentablemente no tengo una referencia además de los enlaces que he proporcionado - me imagino que se puede sacar de referencia adecuados para la distribución hipergeométrica de la página de la Wikipedia.

Esto ignora la pregunta acerca de si los grupos raciales a y D se encuentran "bajo" tela de juicio". Soy escéptico podría hacer un argumento legal para ello, sería un extraño giro en la cláusula de igual protección, Este grupo en particular es demasiado protegido!, que no creo que pudiera volar. (Yo no soy un abogado, aunque - a fin de tomar con un grano de sal).

Si usted realmente desea una prueba de hipótesis no estoy seguro de cómo ir sobre él. Puede generar el $30 \choose 10$ permutaciones, darle una probabilidad en la anulación de los grupos raciales siendo igualmente elegido por sus proporciones en el venire, y luego calcular la distribución exacta de la estadística de prueba bajo el null. No estoy muy seguro de lo estadístico de prueba es satisfactoria, aunque, $\chi^2$ no contesta la pregunta de interés. (Está bien que usted haga su propia estadística de prueba-no sé?)


He actualizado algunos de mis pensamientos en un blog. Mi post es específico para Batson Retos, por lo que no está claro si buscan otra situación (sus actualizaciones para 1 y 2 no tienen sentido en el contexto de Batson Desafíos.)

Yo era capaz de encontrar un artículo relacionado (disponible en su totalidad en el enlace):

Gastwirth, J. L. (2005). Caso comentar: pruebas estadísticas para el análisis de los datos sobre las recusaciones sin causa: aclarando el estándar de la prueba necesaria para establecer un caso prima facie de discriminación en Johnson v. California. La ley, Probabilidad y Riesgo, 4(3), 179-185.

Que le dio a la misma sugerencia para el uso de la distribución hipergeométrica. En mi blog voy a mostrar cómo, si el colapso de las categorías en dos grupos, esto es equivalente a la prueba Exacta de Fisher.

Gastwirth sugiere como hice en mi comentario que usted podría considerar la posibilidad de $k$ como el estadístico de prueba, y así agregar la probabilidad de $k = 5$ $k = 6$ a que, por encima de si usted prefiere. Gastwirth también da un ejemplo para el cálculo de un estadístico de prueba basado en el cambio de número de $n$ en el jurado. En mi blog acabo de conducta de un análisis de sensibilidad para diferentes niveles de $n$ $d$ (para un caso diferente) para proporcionar los rangos de posibles porcentajes.

Si alguien se de cuenta de la jurisprudencia que realmente utiliza esta (o cualquier cosa, además de fracciones) yo estaría interesado.

3voto

Matt Puntos 918

Me gustaría pensar que la introducción de un ad hoc método estadístico que va a ser un no-go con el tribunal. Es mejor utilizar métodos que son una "práctica estándar". De lo contrario, usted probablemente obtendrá a demostrar sus aptitudes para desarrollar nuevos métodos.

Para ser más explícitos, no creo que su método podría satisfacer la Daubert estándar. Yo también dudo mucho de que su método tiene cualquier académico de referencia en y de sí mismo. Usted probablemente tendría que ir a la ruta de la contratación de un estadístico de los testigos expertos para introducir. Sería fácilmente contrarrestado, yo creo.

La cuestión fundamental aquí es probable que: "Fue jurado reto independiente de los grupos raciales?"

Estos son pequeños números a los que sea de aplicación asintóticamente basados en métodos estadísticos. Sin embargo, el "estándar" para las pruebas de asociación en este escenario es de la $\chi^2$ prueba de:

> M <- as.table(cbind(c(9, 6, 2, 3), c(1, 4, 4, 1)))
> dimnames(M) <- list(Group=c("A", "B", "C", "D"), Challenged=c("No", "Yes"))
> M
     Challenged
Group No Yes
    A  9   1
    B  6   4
    C  2   4
    D  3   1

> chisq.test(M)

        Pearson's Chi-squared test

data:  M
X-squared = 5.775, df = 3, p-value = 0.1231

Warning message:
In chisq.test(M) : Chi-squared approximation may be incorrect

Utilizando la prueba exacta de Fisher da resultados similares:

> fisher.test(M)

        Fisher's Exact Test for Count Data

data:  M
p-value = 0.1167
alternative hypothesis: two.sided

La nota acerca de la hipótesis de dos caras se aplica para el caso de una $2\times2$ tabla.

Mi interpretación es que no hay mucha evidencia para argumentar los prejuicios raciales.

0voto

Andrew Puntos 629

No olvidemos el tema de pruebas múltiples. Imagina 100 defensa a abogados cada buscando motivos para apelar. Todos los rechazos del jurado habían sido realizadas por bancos monedas o dados del balanceo para cada miembro del jurado anticipado. Por lo tanto, ninguno de los rechazos eran racialmente predispuesta.

Cada uno de los 100 abogados ahora hace cualquier prueba estadística todos los chicos están de acuerdo en. Aproximadamente cinco de esa voluntad 100 rechazar la hipótesis nula de "imparcial" y tienen motivos de apelación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X