4 votos

Debería elemento nonresponses ser removido antes de calcular Welch la prueba de la t?

He realizado una encuesta en la que una de las preguntas que utiliza una rejilla para dejar que la gente expresar preferencias por diferentes características de algo, utilizando una Likert como escala para cada característica. Lo programé los valores 1-5. De las personas encuestadas otoño en dos distintos subgrupos; subgrupo había más personas en ella. Aquí una ilustración de los resultados (encuesta real había más gente y más las preguntas). Las columnas son individuales, las respuestas de la gente:

group1 = {
 "feature1" : [5, 1, 4, 5, 2, 5, 5, 4, 4, 2],
 "feature3" : [3, 5, 2, 3, 4, 2, 0, 2, 1, 2],
 "feature2" : [3, 3, 2, 1, 2, 3, 3, 1, 2, 4],
}

group2 = {
 "feature1" : [5, 4, 5, 0, 4, 3],
 "feature2" : [1, 4, 1, 0, 4, 4],
 "feature3" : [2, 5, 3, 4, 3, 2],
}

En algunos casos, a veces una persona no dio una calificación para una característica determinada. Esto se representa como 0 en la lista de arriba. Por ejemplo, la 4ª persona en el grupo 2 no dan respuestas de las características 1 y 2, y sólo respondió a cuentan con 3 (aquí, con una calificación de "4"). No tengo manera de saber por qué la gente ocasionalmente se hizo. (No siempre la misma persona, no siempre es el mismo pregunta.)

Pregunta: Si quiero hacer Welch la desigualdad de varianzas prueba t para la las respuestas de los dos grupos para cada característica, ¿cómo debo tratar el elemento nonresponses? En términos concretos, si puedo usar Python SciPy s stats.ttest_ind y que la pasen de dos listas de valores (uno para cada una de las respuestas del grupo a un determinado característica de la pregunta, o en otras palabras, para que una fila en los dos diccionarios de las respuestas que se muestra arriba), a continuación, cuál de las siguientes es la corrección de enfoque?

  1. dejar el 0 en las listas de valores que se pasan a stats.ttest_ind
  2. quitar el 0 de las listas de valores que se pasan a stats.ttest_ind

Por un lado, puedo argumentar que la eliminación de los 0 es correcta porque no son respuestas reales-son sólo el lugar de los titulares que hemos utilizado para el código de la resultados. Por otro lado, si el 0 es eliminado, entonces parece que no cambiaría la media de la muestra para el uno o el otro grupo en la prueba de t de cálculo, debido a que hay menos respuestas que las que hay en el subgrupo.

No sé lo suficiente de estadísticas para saber si lo correcto. Alguien puede por favor explique lo que el lo que hay que hacer en esta situación?

2voto

jasonmray Puntos 1303

'0' es arbitraria etiqueta que se ha utilizado para la no-respuesta. Tratarlo como un número implicaría que la falta de respuesta expresa el menor grado de satisfacción que cualquiera de los otros valores en las escalas—como usted ha dicho, usted no tiene ninguna idea de por qué la gente no responde, que no parece sensato. Lo que si había codificado la falta de respuesta como '99'?

La asignación de '0' a cualquiera de los otros valores en la escala es igualmente problemático. @Carl sugiere la asignación a '3', citando un estudio que afirma que poco importa que el 'punto medio' en una escala de Likert es etiquetados 'indecisos' o 'neutral': I no puede ver lo que lleva a la cuestión de cómo tratar a los no-respuestas (por otra parte—es '3', en algún sentido, un punto medio en su Likertcomo escala?). Las posibles razones para que alguien no responde podrían incluir sus nunca haber usado esa función, no entender la pregunta, omitiendo el elemento por error; por lo que es una valiente decisión compararlo con la selección de una respuesta que, después de todo, podía haber elegido—de hecho, se le pedirá que seleccione—había que quería. Usted tendría que estar muy seguro de que podría explicar por qué la gente no responde, y que no tenía probabilidades de bulto con las personas que hicieron elija alguna respuesta en particular, al menos para los fines de su estudio. Mejor en general a admitir simplemente que ellos no dicen lo que piensan y ver donde se puede ir de allí.

La exclusión de la no-respuestas plantea dos preguntas. En primer lugar, ¿cuál es la población que está interesado en hacer inferencias acerca de? Por desgracia, es poco probable que sea sólo de las personas que responden a las preguntas de la encuesta acerca de una característica. Pero bien puede ser sólo a las personas que están familiarizados con una característica, así que no hay daño en la exclusión de las personas que no lo son, si es que la no-respuesta. En segundo lugar, son los no respondedores típicamente va a tener opiniones diferentes a la respuesta (dentro de cada grupo)? Probablemente no cuando saltan de un elemento debido a una distracción momentánea; posiblemente cuando no pueden seguir a la pregunta; probablemente cuando piensan que van a tener problemas si ellos dicen que no está interesado en una característica. Voy a notar de paso que es una buena práctica utilizar los resultados de un estudio piloto para ajustar el diseño para minimizar las tasas de no-respuesta, y para el seguimiento de algunos de los no respondedores a investigar más a fondo.

Por supuesto, usted sabe que su encuesta mejor que yo, así que tendrás que decidir qué supuestos puede sensatez hacer para justificar la exclusión de la no-respuesta, si usted puede en todo. Que dicen que hay "algunos" casos es motivo para el optimismo. Un cheque de algún tipo, es aconsejable: sencillo, a pesar de los estrictos requisitos, uno sería el conjunto de todas las no-respuestas 1 para el Grupo 1 y 5 para el Grupo de 5, y viceversa; y ver cuánta diferencia hace a sus conclusiones. Podría ser una buena idea comparar los porcentajes de no respuesta entre los dos grupos, si que puede ayudar a probar su hipótesis.

Un enfoque más complejo es la imputación de los valores faltantes. Si se puede predecir la respuesta de alguien hasta el punto de Característica 2, digamos, bastante bien de su respuesta a los puntos sobre las Características 1 y 3, entonces usted tiene una manera de llenar los espacios en blanco para que los no respondedores. Aquí el supuesto es que la falta de respuesta en un elemento en particular son normalmente no van a tener opiniones diferentes a la respondedor dado sus respuestas a otros elementos. Probablemente necesite hacer algunos estudios o conseguir la ayuda si quería ir por este camino.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X