Prueba t pareada para datos asimétricos

Question

Prueba t pareada para datos asimétricos

Preguntado el 17 de Octubre, 2016: Cuando se hizo la pregunta
3289 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Tengo una cohorte de sujetos (n=262) con una intervención única. Se ha pedido a los sujetos que respondan a un cuestionario antes y después de la intervención. El cuestionario consta de cinco ítems en los que cada uno de ellos está en el rango [0, 1, 2, 3] y la puntuación total es el valor medio de estos 5 ítems. Así, la puntuación total de cada sujeto viene dada por un número racional en el rango 0-3.

Este es el histograma de sus respuestas:

He aplicado una prueba t pareada estándar para encontrar un efecto de la intervención en la cohorte y he encontrado (con python stats):

>> scipy.stats.ttest_rel(data_before, data_after)    
>>Ttest_relResult(statistic=3.4864105747384686, pvalue=0.00074914757737233801)

Por lo tanto, parece interesante y apoya muy bien mi hipótesis de que la intervención ha afectado a la cohorte. Pero me pregunto si la aplicación de la prueba t pareada en estos datos sesgados con n=262 está justificada en este caso.

¿Alguna sugerencia para comprobar mis resultados con otras pruebas?

ACTUALIZACIÓN

He compartido los datos a través de Dropbox

Preguntado el 17 de Octubre, 2016 por radvan72

Answer 1

1 Respuestas

Answer 2

3voto

AdamSane Puntos 1825

Los valores originales no se suponen normales, las diferencias sí, por lo que la asimetría de los dos primeros histogramas no es un problema.

Aunque sus diferencias no son normales, están acotadas, son relativamente simétricas y no tienen una cola muy pesada (algo gorda, con un pico en el centro, pero la acotación ayuda), así que esto puede no afectar mucho a la prueba t.

La principal preocupación sería que parece que podría haber muchos valores 0, pero una simulación rápida con números muy similares a los suyos parece indicar que hay muy pocos problemas con la distribución del estadístico t habitual de una muestra, es decir, el nivel de significación debería estar muy cerca del nivel elegido.

La potencia podría verse ligeramente afectada por las colas más pesadas, pero no me preocuparía mucho en este caso.

Realmente no veo que haya mucho problema aquí.

Si le preocupan los desafíos de la prueba t, siempre puede considerar una prueba de permutación de las diferencias de medias. [Una alternativa podría ser una prueba de rangos con signo de Wilcoxon, pero la elevada proporción de empates podría ser motivo de preocupación].

Respondido el 17 de Octubre, 2016 por AdamSane (1825 Puntos )

Prueba t pareada para datos asimétricos

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Prueba t pareada para datos asimétricos

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: