2 votos

Prueba t pareada para datos asimétricos

Tengo una cohorte de sujetos (n=262) con una intervención única. Se ha pedido a los sujetos que respondan a un cuestionario antes y después de la intervención. El cuestionario consta de cinco ítems en los que cada uno de ellos está en el rango [0, 1, 2, 3] y la puntuación total es el valor medio de estos 5 ítems. Así, la puntuación total de cada sujeto viene dada por un número racional en el rango 0-3.

Este es el histograma de sus respuestas:

enter image description here

He aplicado una prueba t pareada estándar para encontrar un efecto de la intervención en la cohorte y he encontrado (con python stats):

>> scipy.stats.ttest_rel(data_before, data_after)    
>>Ttest_relResult(statistic=3.4864105747384686, pvalue=0.00074914757737233801)

Por lo tanto, parece interesante y apoya muy bien mi hipótesis de que la intervención ha afectado a la cohorte. Pero me pregunto si la aplicación de la prueba t pareada en estos datos sesgados con n=262 está justificada en este caso.

¿Alguna sugerencia para comprobar mis resultados con otras pruebas?

ACTUALIZACIÓN

He compartido los datos a través de Dropbox

3voto

AdamSane Puntos 1825

Los valores originales no se suponen normales, las diferencias sí, por lo que la asimetría de los dos primeros histogramas no es un problema.

Aunque sus diferencias no son normales, están acotadas, son relativamente simétricas y no tienen una cola muy pesada (algo gorda, con un pico en el centro, pero la acotación ayuda), así que esto puede no afectar mucho a la prueba t.

La principal preocupación sería que parece que podría haber muchos valores 0, pero una simulación rápida con números muy similares a los suyos parece indicar que hay muy pocos problemas con la distribución del estadístico t habitual de una muestra, es decir, el nivel de significación debería estar muy cerca del nivel elegido.

La potencia podría verse ligeramente afectada por las colas más pesadas, pero no me preocuparía mucho en este caso.

Realmente no veo que haya mucho problema aquí.

Si le preocupan los desafíos de la prueba t, siempre puede considerar una prueba de permutación de las diferencias de medias. [Una alternativa podría ser una prueba de rangos con signo de Wilcoxon, pero la elevada proporción de empates podría ser motivo de preocupación].

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X