Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

5 votos

Definición formal de la asignación aleatoria

Estoy buscando una definición formal de asignación al azar.

Deje que Z ser un vector de asignaciones de tratamiento en el que cada elemento es 0 (unidad no asignada al tratamiento) o 1 (unidad asignada al tratamiento). En un artículo de la JASA, Angrist, Imbens y Rubin (1996, 446-47) dicen que la asignación de tratamiento Zi es aleatorio si Pr para todos \mathbf {c} y \mathbf {c'} de tal manera que \iota ^T \mathbf {c} = \iota ^T \mathbf {c'} donde \iota es un vector de columna con todos los elementos iguales a 1.

En palabras, la definición parece ser ésta: asignación Z_i es aleatorio si cualquier vector de asignaciones que incluya m asignaciones al tratamiento es tan probable como cualquier otro vector que incluya m asignaciones para el tratamiento.

Esta definición parece insatisfactoria. ¿Y si decido a priori que quiero descartar un determinado vector de asignaciones y elegir uno de los vectores restantes al azar? Esta práctica no satisfaría la definición de AIR, pero seguiría siendo una asignación aleatoria.

Aquí hay un ejemplo. Imagine una asignación binaria al tratamiento para cada uno de los dos sujetos. Deje que \mathbf {Z} ser el vector de las asignaciones de tratamiento. Luego \mathbf {Z} tiene cuatro valores posibles: {0, 0}, {0, 1}, {1, 0}, y {1, 1}. Según la definición de AIR, la asignación es aleatoria sólo si \Pr ( \mathbf {Z} = \{1, 0\}) = \Pr ( \mathbf {Z} = \{0, 1\}) . Pero ¿por qué debería ser ésta la definición de asignación aleatoria, o incluso una condición necesaria para ello? ¿Qué pasa si simplemente decido que quiero descartar {0, 1} y elegir al azar de los tres vectores restantes? Parece que esta práctica es consistente con el entendimiento convencional de la asignación al azar pero inconsistente con la definición de AIR.

Entonces: ¿hay una definición formal de asignación aleatoria que abarque la idea de que el experimentador puede descartar algunos vectores de asignación a priori?

8voto

StasK Puntos 19497

Mientras que Michael Chernick dio una buena respuesta No creo que las personas que participan en la estimación de los efectos del tratamiento piensen en términos de poblaciones finitas e inferencias basadas en la aleatoriedad. Los economistas (Angrist e Imbens son conocidos economistas) normalmente no lo hacen; si la OP proviene de la misma tradición, ese es el tema central de esta pregunta.

En cambio, los economistas tienen una perspectiva de modelo, en la que hay una población conceptual de la que se toman las unidades, y hay una especie de invariante de permutación implícita, o "las etiquetas no importan", suposición que se hace para estas unidades de muestra. Es esta invariancia de permutación la que se caracteriza y cuantifica en la definición dada por la OP. Sin embargo, en las poblaciones finitas se supone que cada unidad es única, y negarle un determinado tratamiento en el mecanismo de aleatorización produciría un efecto de tratamiento inestimable. Resulta muy difícil pasar de la inferencia basada en el modelo a la inferencia basada en la aleatorización; esto puede haberse hecho en el documento citado, pero no muy claramente.

3voto

mat_geek Puntos 1367

Esta definición de asignación aleatoria parece estar asignando con igual probabilidad. Asignar un peso 0 a cualquiera de las posibles asignaciones podría crear un sesgo y debería considerarse una asignación no aleatoria por cualquier definición. Sin embargo, el muestreo con pesos desiguales no nulos puede ser un procedimiento aceptable (por ejemplo, el muestreo aleatorio proporcional al tamaño o el muestreo aleatorio estratificado con muestras desiguales por estrato son ejemplos de muestreo de encuesta). Se ajustan a una definición más general de muestreo aleatorio. Si se está estimando una media, se puede utilizar un promedio ponderado para obtener una estimación no sesgada de la media de la población. Al excluir un posible resultado se cambia la población y no es apropiado sacar una inferencia de la gran población de la que se ha decidido no muestrear. Además, debido a que se excluyeron las posibles muestras, es imposible hacer un ajuste ponderado para garantizar una estimación no sesgada de la media de la población no restringida.

2voto

simmosn Puntos 304

Una cosa que notarán en el periódico AIR es que no condicionan las covariables X . Puedes generalizar la exposición al aire haciendo esto.

Deje que X ser un indicador de si un sujeto es hombre. Suponga también que quiere que los hombres tengan más probabilidades de recibir tratamiento que las mujeres. Puedes tener \begin {equation*} \Pr (z = c \mid X=1) = \Pr (z = c^ \prime \mid X=1) \end {equation*} y \begin {equation*} \Pr (z = c \mid X=0) = \Pr (z = c^ \prime \mid X=0), \end {equation*} pero \begin {equation*} \Pr (z = c \mid X=1) > \Pr (z = c \mid X=0) \end {equation*} y aún así satisfacer la asignación aleatoria en este contexto. Esto justificaría el muestreo estratificado, por ejemplo.

La diferencia entre esta generalización y otra en la que sólo se excluyen los vectores arbitrarios es que aquí cada persona de un determinado estrato tiene la misma probabilidad de entrar en el tratamiento, mientras que su sugerencia se dirigiría a personas específicas para que tengan menos probabilidades de entrar en el tratamiento. Si se pudiera hacer esto de manera sistemática sobre la base de las características observables de las observaciones, como en el caso de la estratificación, se estaría a salvo, pero una retención no sistemática de algunos miembros de la población puede sesgar los resultados.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X