8 votos

¿Cómo se obtienen los estimadores como el de Horvitz-Thompson?

El estimador de Horvitz-Thompson suele venir dado por:

$$ \hat{Y}_{HT} = \sum_{i=1}^n \pi_i ^{-1} Y_i $$

La prueba de que es imparcial es trivial. Además, existen otros estimadores para diferentes diseños, como los de Rubin y Rosenbaum (1983). Sin embargo, en cada uno de los artículos originales, el estimador parece aparecer de la nada sin ninguna motivación, sólo aparece para que el autor pueda demostrar que es insesgado.

Mi pregunta es, ¿existe una forma sólida de obtener estimadores insesgados como ese?

0 votos

¿Qué quiere decir con "normalmente"? Que ES la definición. El hecho de que este estimador se aplique a estudios observacionales en tareas de emparejamiento y similares es un poco desafortunado: La H-T se propone como una forma de trabajar con muestras de población finita, mientras que el uso de estimadores ponderados en estudios observacionales / muestras emparejadas es esencialmente para generalizar a la "población" de tamaño 2 por unidad de muestra -- a saber, los dos resultados contrafactuales. La varianza de H-T se deriva de los principios de muestreo; el libro de Rubin sobre el muestreo emparejado ni siquiera tiene una entrada de índice para la varianza.

0 votos

Muéstranos el trabajo "trivial" para demostrar la imparcialidad. Una respuesta publicada también dice que esto es "trivial". Bueno, tal vez todavía tengamos que discutir esas trivialidades. Y mis favoritos sobre los diseños de muestreo son Brewer y Hanif (1983) y Tille (2006); discutamos estos también.

1 votos

Mi pregunta es, ¿qué pasó por la mente de los autores al crear estimadores como estos? ¿Hubo una forma de derivarlos o fue más bien por ensayo y error hasta lograr la insesgadez?

2voto

Ran Kerry Puntos 1

el estimador parecía aparecer de la nada sin ninguna motivación

Si la idea del muestreo estratificado es intuitiva, entonces creo que Horvitz-Thompson debería venir como una extensión natural, no es algo fuera de lo común.

Para ilustrar cómo una simple muestra estratificada puede ayudarle a elaborar la fórmula, considere un caso con dos estratos, $S_1$ y $S_2$ de tamaños conocidos $N_1$ y $N_2$ y supongamos que se obtienen muestras $n_1$ y $n_2$ respectivamente. Ahora imagina que calculas la media de cada muestra $\bar{y}_1$ y $\bar{y}_2$ .

¿Cómo utilizaría esta información para estimar el total de $Y$ ? La forma natural es tomar la media estimada de cada estrato y multiplicarla por el número total (de población) de elementos del estrato:

$$ \hat{Y} = N_1 \bar{y}_1 + N_2 \bar{y}_2 $$

Pero toma esta simple expresión y reescríbela como

$$ \begin{align} \hat{Y} &= N_1 \sum_{i \in S_1}\frac{y_i}{n_1} + N_2 \sum_{i \in S_2}\frac{y_i}{n_2}\\ &= \sum_{i \in S_1}\frac{y_i}{n_1/N_1} + \sum_{i \in S_2}\frac{y_i}{n_2/N_2}\\ &= \sum_{i} \frac{y_i}{\pi_i} \end{align} $$

Donde $\pi_i = n_1/N_1$ si $i\in S_1$ y $\pi_i = n_2/N_2$ si $i\in S_2$ . Es decir, un simple muestreo estratificado ya te da a entender que, en esencia, lo que estamos haciendo es sumar cada muestra $y_i$ ponderado por su probabilidad de selección. Entonces, la idea de una ponderación general de la probabilidad inversa, donde cada $\pi_i$ podría ser diferente, debería ser natural.

0 votos

No veo ninguna expectativa única. ¿Cómo puedes decir que eres imparcial si no has tomado un valor esperado?

2 votos

@StasK el OP no está preguntando sobre la imparcialidad, ya sabe que es imparcial (y la prueba es trivial). El OP preguntaba sobre cómo podría alguien tener la intuición para llegar a la fórmula. Y de hecho, algunos textos presentan la fórmula sin ninguna pista o contexto.

1voto

Me gustaría dar un enfoque diferente a la respuesta aceptada. La respuesta aceptada justifica la intuición detrás de la ponderación de la probabilidad inversa, pero me gustaría justificar por qué tiene sentido llegar al estimador de Horvitz-Thompson en lugar de a algún otro estimador. Puede derivarse de dos propiedades:

  1. El estimador es un combinación lineal de las respuestas a la encuesta. Esta propiedad es una ventaja porque nos permite calcular las expectativas (y las varianzas) sin tener en cuenta todas las muestras posibles, y en su lugar sólo tratar con las probabilidades (conjuntas) de selección de las unidades individuales.

  2. El estimador es imparcialidad (como ya ha señalado). Esta es una buena propiedad porque hace que la estimación final sea más fácil de interpretar/explicar a otra persona.

El estimador de Horvitz-Thompson es el único estimador con estas dos propiedades. En mi opinión, la forma más intuitiva de abordarlo es:

  1. Justifica las dos propiedades anteriores,

  2. Utilice la propiedad 1 para definir la estructura del estimador ( $\sum w_i y_i$ ),

  3. Utilice la propiedad 2 para demostrar que $w_i=\pi_i^{-1}$ y luego,

  4. Demuestre que esto es único (por ejemplo, considere un $y_i$ valores)

0 votos

Así es como se ofrece la justificación del estimador de Horvitz-Thompson en los libros de muestreo. Sin embargo, me gustaría señalar que las cantidades aleatorias son indicadores de inclusión de la muestra, y la insesgadez del estimador de Horvitz-Thompson es con respecto a estos (con $y_i$ tratados como fijos).

0 votos

Tal vez estoy demasiado cerca del tema. Esta es la respuesta intuitiva para mí. Cuando tenía preguntas del tipo "¿Por qué esto?", era la justificación de la propiedad 1 la que las aclaraba.

1 votos

@StasK la justificación formal no es la forma en la que uno se plantearía la idea. Por ejemplo, no es que newton inventara el cálculo pensando en la definición adecuada de los límites, etc. ¡RoryT tu respuesta también está perfectamente bien! Una pregunta sin embargo -- digamos que la TH no existiera. ¿Dirías que lo intuirías naturalmente de esta manera y lo inventarías tú mismo?

-1voto

Schemer Puntos 115

En primer lugar, hay que tener en cuenta que el estimador Horvitz-Thompson (H-T) se utiliza tanto para $\textit{with or without replacement}$ diseños de muestreo aleatorio.

$\pi$ es la probabilidad de inclusión. El estimador H-T nos proporciona una estimación del total de la población.

Como ilustración sencilla, un estimador "similar" a Horvitz-Thompson puede derivarse como sigue:

Si dejamos que $\pi = \frac{n}{N}$ , donde $n$ es el tamaño de la muestra y $N$ es el tamaño de la población, y lo sustituimos en el estimador H-T, entonces, tras la simplificación, obtenemos que $\hat{Y} = N\frac{Y}{n} = N\bar{y}$ .

Demostrar que dicho estimador es insesgado es ahora una tarea sencilla.

1 votos

No entiendes cuál es el espacio de probabilidad aquí. Es el de los indicadores de muestreo, no el de las mediciones $y_i$ .

1 votos

@StasK ¡Tienes toda la razón en esto! ¡Gracias por señalarlo! Acabo de darme cuenta de mi gran fallo al escribir eso $\pi = N\bar{y}$ lo cual no es cierto y puede ser fácilmente malinterpretado. También me gustaría añadir que el estimador que he dado más arriba puede considerarse como un estimador "tipo Horvitz-Thompson". Haré la corrección.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X