6 votos

Gestión de ' prefiere no dice ' en cuestionarios sensibles

Considere la posibilidad de un cuestionario donde le preguntamos a alguien sobre su sexualidad. Las cinco opciones, por simplicidad, son:

  • Heterosexual
  • Homosexual
  • Bisexual
  • Otros
  • 'Prefiero no decirlo'

Asumir pedimos a la población. Nosotros no recogemos ninguna otra información acerca de ellos, excepto su sexualidad.

Tenemos la sospecha razonable de que 'prefiere no dice' no faltan al azar. Pensamos que la probabilidad de que un individuo selección de 'prefiere no decir" va a ser mayor para las personas que son homosexuales, bisexuales y otros(s).

Así que si se tira de la 'prefiere no dice' vamos a estar informando sobre un subconjunto de la población que, como sabemos, es sesgada.

Preferimos un informe sobre los datos, incluyendo el "prefieren que no se dice', la incorporación de nuestra incertidumbre de cómo se distribuyen.

Por ejemplo:

  • Heterosexual - 60%
  • Homosexual - 10%
  • Bisexual - 10%
  • Otros - 10%
  • 'Prefiero no decir' - 10%

En teoría (aunque poco probable), cada uno de los 'prefiere no decir' podría ser heterosexual. Así que sabemos que el porcentaje de heterosexuales en la población debe estar entre el 60-70%.

Sin embargo, podemos hacer una mejor y el informe de un intervalo de confianza de algún tipo? Todo lo que podía pensar era en la creación de una antes de la distribución de probabilidad de la 'prefiere no dice" y la creación de un intervalo creíble de que.

2voto

StasK Puntos 19497

La contestación de su técnica específica pregunta -- la teoría de la inferencia para parcialmente identificado distribuciones ha sido desarrollado en la obra de Charles Manski. En tu ejemplo, el intervalo de confianza sería (60% menos 1,96 veces sea cual sea el error estándar corresponde al 60% de la asunción, un 70% más 1,96 veces sea cual sea el error estándar corresponde al 70% de la asunción).

Se puede hacer algo diferente estadísticamente, y tratar "Prefiero no decir" como la falta de datos. Entonces usted puede imputar las respuestas (mejor, utilizando múltiples de la imputación) basado en las covariables adicionales, tales como los comportamientos y las actitudes hacia la religión, por ejemplo), etc.

Finalmente, para rectificar el problema en su origen, usted necesita para diseñar su instrumento de manera diferente. Dicen que no hay preguntas sensibles, pero no son sensibles respuestas a algunas preguntas. La respuesta "heterosexual" no es especialmente sensible, pero no respuestas directas. Yo no soy un cuestionario diseñador, yo no puedo guía muy lejos, pero hay un montón de recursos, ya saben, de libros encuadernados como el que solían tener en el siglo XX, a los Mooc.

1voto

Awais Tariq Puntos 116

Usted no puede llegar allá desde aquí, en mi punto de vista. Si hay muy pocos prefieren-no-a-decir, se puede omitir sin mucho sesgo. Sin embargo, si usted tiene un montón en esa categoría (5% o más), entonces creo que usted necesita un diseño diferente. Como ... ni siquiera se les pregunta si "no sabe no contesta"!

Hay maneras de plantear las preguntas sensibles. En un método, se dice a la gente a contestar con la verdad o a la mentira, de acuerdo con algún proceso aleatorio (oculto para el entrevistador) dirige a ellos. Utilizando el conocido probabilidad de que una mentira, se puede inferir que la proporción con una característica particular sin conocer las características reales de cualquier individuo. Esto funciona para los binarios de preguntas.

Me gusta tu idea de ir Bayesiano en esto si usted tiene información previa acerca de la "prefieren que no se dice".

0voto

akjoshi Puntos 6711

(agregar una estadística de respuesta complementaria a mi comentario en la parte superior)

Tenemos la sospecha razonable de que 'prefiere no dice' no faltan al azar. Pensamos que la probabilidad de que un individuo selección de 'prefiere no decir" va a ser mayor para las personas que son homosexuales, bisexuales y otros(s)

Aquí se quiere reducir el 'prefiere no dice" respuestas a otras categorías en un statisticaly correcta y de manera significativa.

Esto sería correcto bajo las siguientes condiciones:

1) El resto de opciones son independientes y los sucesos elementales del espacio muestral

2) El resto de opciones de la partición del espacio muestral completo (y de forma representativa)

3) Las probabilidades previas de el resto de las opciones se pueden infered indepentantly

Entonces uno puede de hecho reducir el 'prefiere no decir las respuestas (o de otros tipos en el mismo vano) a la escuela primaria opciones (particiones) usando la respuesta de datos para calibrar la reducción (dentro de un estadístico significativo rango)

Para el ejemplo de la pregunta (y similares ejemplos dados en los comentarios) esto no es así. Si uno insiste en que efectivamente respalda la perogrullada de que "hay mentiras, grandes mentiras y estadísticas".

De wikipedia Imputación Estadística

[M]ost paquetes estadísticos predeterminado para descartar cualquier caso, que tiene un falta de valor, lo que puede introducir un sesgo, o afectar a la la representatividad de los resultados

prefiero no tomar tales questionares no importa la forma en que se comercializan. Permítanme darles otro ejemplo similar que hace el párrafo anterior explícito:

Si el proyecto para la guerra en Irak:

a) Vaya a la parte delantera de la línea de

b) Ir a la línea de la espalda

c) Goto paramédicos

d) Prefiero no contestar.

Mejor que ni siquiera tomar estos cuestionarios!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X