el estimador parecía aparecer de la nada sin ninguna motivación
Si la idea del muestreo estratificado es intuitiva, entonces creo que Horvitz-Thompson debería venir como una extensión natural, no es algo fuera de lo común.
Para ilustrar cómo una simple muestra estratificada puede ayudarle a elaborar la fórmula, considere un caso con dos estratos, $S_1$ y $S_2$ de tamaños conocidos $N_1$ y $N_2$ y supongamos que se obtienen muestras $n_1$ y $n_2$ respectivamente. Ahora imagina que calculas la media de cada muestra $\bar{y}_1$ y $\bar{y}_2$ .
¿Cómo utilizaría esta información para estimar el total de $Y$ ? La forma natural es tomar la media estimada de cada estrato y multiplicarla por el número total (de población) de elementos del estrato:
$$ \hat{Y} = N_1 \bar{y}_1 + N_2 \bar{y}_2 $$
Pero toma esta simple expresión y reescríbela como
$$ \begin{align} \hat{Y} &= N_1 \sum_{i \in S_1}\frac{y_i}{n_1} + N_2 \sum_{i \in S_2}\frac{y_i}{n_2}\\ &= \sum_{i \in S_1}\frac{y_i}{n_1/N_1} + \sum_{i \in S_2}\frac{y_i}{n_2/N_2}\\ &= \sum_{i} \frac{y_i}{\pi_i} \end{align} $$
Donde $\pi_i = n_1/N_1$ si $i\in S_1$ y $\pi_i = n_2/N_2$ si $i\in S_2$ . Es decir, un simple muestreo estratificado ya te da a entender que, en esencia, lo que estamos haciendo es sumar cada muestra $y_i$ ponderado por su probabilidad de selección. Entonces, la idea de una ponderación general de la probabilidad inversa, donde cada $\pi_i$ podría ser diferente, debería ser natural.
0 votos
¿Qué quiere decir con "normalmente"? Que ES la definición. El hecho de que este estimador se aplique a estudios observacionales en tareas de emparejamiento y similares es un poco desafortunado: La H-T se propone como una forma de trabajar con muestras de población finita, mientras que el uso de estimadores ponderados en estudios observacionales / muestras emparejadas es esencialmente para generalizar a la "población" de tamaño 2 por unidad de muestra -- a saber, los dos resultados contrafactuales. La varianza de H-T se deriva de los principios de muestreo; el libro de Rubin sobre el muestreo emparejado ni siquiera tiene una entrada de índice para la varianza.
0 votos
Muéstranos el trabajo "trivial" para demostrar la imparcialidad. Una respuesta publicada también dice que esto es "trivial". Bueno, tal vez todavía tengamos que discutir esas trivialidades. Y mis favoritos sobre los diseños de muestreo son Brewer y Hanif (1983) y Tille (2006); discutamos estos también.
1 votos
Mi pregunta es, ¿qué pasó por la mente de los autores al crear estimadores como estos? ¿Hubo una forma de derivarlos o fue más bien por ensayo y error hasta lograr la insesgadez?
1 votos
Si tiene una variable $I_i$ que toma valores 0 y 1 con probabilidades conocidas, se sabe que el valor esperado es $\pi_i$ por lo que si quieres que parezca 1, tienes que dividir por $\pi_i$ . Eso es todo.