4 votos

¿Es este método de llegar a una estadística válida?

El siguiente es un extracto de un artículo sobre el sesgo de género :

En general, el 34 por ciento de los encuestados admitió que su familia preferido tener más niños. Dada la naturaleza sensible de este pregunta, este número es un límite inferior, ya que algunas personas se sin duda, dar respuestas socialmente deseables.

Con el fin de estimar el verdadero nivel de preferencia por el hijo varón, nos encontramos con una lista de "experimento" que protege el anonimato de la encuesta de las respuestas. Los participantes fueron divididos aleatoriamente en dos grupos, dada una lista de afirmaciones, y luego se le pedirá el número de declaraciones con lo cual estuvieron de acuerdo. Sólo la mitad de los encuestados dieron una declaración acerca de la preferencia por el hijo varón, y por lo tanto, hemos sido capaces de estimación de la proporción de encuestados que accedió a las sensibles declaración mediante la comparación de los medios de los dos colectivos encuestados. El uso de esta técnica, hemos encontrado que una vez concedido el manto del anonimato, 48 por ciento de los encuestados tienen preferencia por los hijos varones en su familia.

¿Esta técnica es válida? Si es así, ¿cómo funciona exactamente? Esto de la manera que yo lo entiendo (posiblemente errónea):

Ya que los participantes fueron divididos aleatoriamente en 2 grupos, se puede esperar que la distribución de las respuestas de ambos grupos son idénticos cuando ambos grupos se da exactamente la misma encuesta. Ahora bien, decir que un grupo es una lista de 10 de las declaraciones y el otro se da una lista de 11 de declaraciones, las declaraciones de ser el uno sobre el género, la preferencia. Habrá un cambio en la distribución y la diferencia nos da el porcentaje de personas con una preferencia. Es mi interpretación correcta? Si es así, ¿cómo es el porcentaje exacto llegó a?

1voto

Bill Puntos 3605

Suena válido para mí, aunque usted tiene que hacer algunas suposiciones. Supongamos que hay $N$ respondants, y el número de ellos $i=1,2,\ldots,N$. Supongamos que hay diez falsos preguntas y una pregunta real (supongamos que la pregunta real sale a la última, por lo que es la número once). Número de preguntas $k=1,2,\ldots,K,K+1$. Así, en este caso $K=10$ y la pregunta real es de $k=11$. Indicar el (real, veraz) respuesta de la persona $i$ a la pregunta $k$ como: \begin{align} Y_i^k &= \left\{ \begin{array}{l} 1 \; \text{agree}\\ 0 \; \text{disagree} \end{array} \right. \end{align}

Vamos a llamar a la población media de cada $Y^k$, $\mu^k$. Estamos interesados en la media de la población es de $Y^{K+1}$. La media de una variable ficticia es la misma que la probabilidad de que se es que es el mismo, aquí, como la proporción de personas que quiero un muchacho.

Ahora, suponga que el tiempo ya que hay al menos diez preguntas, el demandado dice la verdad. Persona $i$ al azar a diez preguntas se informan $S_i = \sum_{k=1}^K Y^i_k$. La persona aleatorizado en el once preguntas se informan $S_i^+ = Y^{K+1}_i + \sum_{k=1}^K Y^i_k$. Deje $C$ el conjunto de personas asignadas al azar a las diez de la pregunta de tratamiento y $\#(C)$ el número de personas en el conjunto de $C$. Asimismo, para $T$ y la once tratamiento.

Si la aleatorización es buena y en virtud de la presunción de veracidad de presentación de informes, obtenemos: \begin{align} E\left(\frac{1}{\#(C)} \sum_{i \in C}S_i \right) &= E(S) = \sum_{k=1}^K \mu^k\\ E\left(\frac{1}{\#(T)} \sum_{i \in T}S^+_i \right) &= E(S^+)= \mu^{K+1}+\sum_{k=1}^K \mu^k\\ \end{align} La primera igualdad en cada línea es verdadera por los argumentos usuales en los Eca. I. e. consiguen las expectativas correctas para el subyacente variables latentes en el tratamiento y control de armas. Y eso es bastante, la cosa es que estamos interesados en, $\mu^{K+1}$ es unbiasedly estimado por la diferencia de los dos: \begin{align} \mu^{K+1} &= E\left( \frac{1}{\#(T)} \sum_{i \in A}S^+_i -\frac{1}{\#(C)} \sum_{i \in A}S_i\right) \end{align} Hay mucho que hacer en el veraz informes suposición aquí, sin embargo. No es la obvia "tal vez diez no es suficiente para suprimir la mentira". Pero también hay la costumbre de la encuesta de problemas. Tal vez los primeros diez preguntas molestó a los encuestados y que fueron sensación desagradable en la pregunta 11. Tal vez algunos de los encuestados tiene problemas para contar, recordar de dónde están en la cuenta, y pensando en responder a las preguntas (esto no es trivial: el 50% de las personas que tienen debajo de la media de CI). Tal vez esto se pone peor con una pregunta extra. Si los errores de conteo están sesgados en una dirección (y ¿por qué no?), usted puede tener problemas. Uno podría seguir en esta línea por un tiempo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X