Sin saber qué tipo de datos se están evaluando es muy difícil dar un buen consejo aquí. Y realmente, eso es todo lo que se puede conseguir. No existe la mejor medida del tamaño del efecto para cuestiones como ésta... quizá nunca.
Los tamaños del efecto mencionados en la pregunta son todos tamaños del efecto estandarizados. Pero es muy posible que las medias o medianas de las medidas originales estén bien. Por ejemplo, si se mide el tiempo que tarda en completarse un proceso de fabricación, la diferencia de tiempos debería ser un tamaño del efecto perfectamente razonable. Cualquier cambio en el proceso, las mediciones futuras, las mediciones a través de los sistemas y las mediciones a través de las fábricas, estarán todas en el tiempo. Tal vez quiera la media o la mediana, o incluso la moda, pero lo primero que tiene que hacer es mirar la escala de medición real y ver si el tamaño del efecto es razonable de interpretar y está fuertemente conectado a la medida.
Para ayudar a pensar en eso, los efectos que deben ser estandarizados son cosas que se miden más indirectamente y de muchas maneras. Por ejemplo, las escalas psicológicas pueden variar a lo largo del tiempo y de muchas maneras e intentan llegar a una variable subyacente que no se está evaluando directamente. En esos casos, es necesario estandarizar los tamaños de los efectos.
Con los tamaños de efecto estandarizados, la cuestión crítica no es sólo cuál utilizar, sino qué significan. Como insinúas en tu pregunta, tampoco sabes lo que significan y eso es lo crítico. Si no se sabe qué es el efecto estandarizado, no se puede informar correctamente, interpretar correctamente o utilizar correctamente. Además, si hay una variedad de formas de discutir los datos, no hay absolutamente nada que le impida informar de más de un tamaño del efecto. Puede discutir sus datos en términos de relación lineal, como con la correlación del momento del producto, o en términos de relación entre los rangos con Spearman r
y las diferencias entre ellos o simplemente proporcionar toda la información en la tabla. Eso no tiene nada de malo. Pero, sobre todo, tendrás que decidir qué quieres que signifiquen tus resultados. Eso es algo que no puede responderse a partir de la información dada y podría requerir mucha más información y conocimientos específicos del dominio de lo que es razonable para una pregunta en este tipo de foro.
Y siempre hay que pensar en el meta-análisis sobre cómo se informan los efectos. ¿Podrá la gente en el futuro tomar los resultados que estoy reportando e integrarlos con otros? Tal vez exista una norma en su campo para estas cosas. Tal vez haya seleccionado una prueba no paramétrica principalmente porque no confía en las conclusiones que otros han sacado sobre las distribuciones subyacentes y quiere ser más conservador en sus suposiciones en un campo que utiliza principalmente pruebas paramétricas. En ese caso, no hay nada malo en proporcionar adicionalmente un tamaño del efecto que se utiliza normalmente con las pruebas paramétricas. Hay que tener en cuenta estas y muchas otras cuestiones cuando se piensa en cómo situar el hallazgo en una literatura más amplia de investigación similar. Normalmente, las buenas estadísticas descriptivas resuelven estos problemas.
Así que ese es el principal consejo. Tengo algunos comentarios adicionales. Si quieres que el tamaño del efecto esté fuertemente relacionado con la prueba que hiciste, entonces el Z
La recomendación basada en la información es, obviamente, la mejor. Su tamaño del efecto estandarizado significará lo mismo que la prueba. Pero en cuanto no se hace eso, no hay nada de malo en utilizar casi cualquier otra cosa, incluso algo como el coeficiente de Cohen d
que se asocia a las pruebas paramétricas. No hay ningún supuesto de normalidad para calcular las medias, las desviaciones estándar o d
resultados. De hecho, hay supuestos más débiles que para el coeficiente de correlación recomendado. Y siempre informan de buenas medidas descriptivas. Una vez más, las medidas descriptivas no tienen supuestos que usted estaría violando, pero tenga en cuenta su significado sustantivo. Las estadísticas descriptivas que reportas dicen algo sobre tus datos que quieres decir y las medias y medianas dicen cosas diferentes.
Si quiere discutir los tamaños de los efectos de las medidas repetidas frente a los de los diseños independientes, esa es una cuestión totalmente nueva.
0 votos
Bravais-Pearson es nuevo para mí. Supongo que se trata de otro caso en el que Pearson se lleva el mérito cuando otro llegó primero.
1 votos
Ah, sí, parece que tal vez eso es todo .
0 votos
@Glen_b Sí, eso es. Lo siento, siempre me resulta difícil y confuso cuando tengo que traducir terminología estadística al inglés. Por favor, edita la pregunta si conoces el término o términos adecuados.
3 votos
Prefiero dejarlo como está: si Bravais merece crédito en una lengua, ¡también lo merece en otra! Le agradezco que haya llenado un vacío en mi educación.
0 votos
Lol He añadido la fórmula para que quede claro lo que quiero decir.
0 votos
¿Quién dice cuáles y qué justificación ofrecen? ¿Quién llama a la estadística de rango con signo $Z$ ? (¿o se trata de un estadístico de rango con signo estandarizado?). ¿En qué sentido son un tamaño del efecto?
0 votos
En cuanto a Z, eso es lo que arrojan R y SPSS. Véase también mi otra pregunta: stackoverflow.com/questions/27896655/ Que puede utilizarse para calcular el tamaño de los efectos se dice, por ejemplo, en Pallant, J. (2007). Manual de supervivencia de SPSS . p. 225.
0 votos
Ah, veo por tu pregunta enlazada que no te refieres a la prueba de rango con signo de R, te refieres a una del paquete
coin
.1 votos
Sí, porque necesito una prueba que pueda manejar los empates.
0 votos
¿Por qué no calcular el tamaño del efecto como $z/\sqrt{n}$ de forma análoga al tamaño del efecto de la prueba t de muestras pareadas $t/\sqrt{n}$ ?
2 votos
La instrucción del libro que cito en mi comentario anterior (Pallant, 2007, p. 225) dice que el
n
en $\sqrt{n}$ es el número de todas las observaciones, es decir, la suma de la longitud de ambos vectores, es decir $n = n_x + n_y$ y no el número de participantes. Así que la fórmula es la misma, sólo hay que entender correctamente lo que significa "n". Si no es así, por favor, instrúyame. Al fin y al cabo, esto es a lo que apunta mi pregunta.0 votos
@ttnphns Mira la imagen que adjunté a mi pregunta.
0 votos
Muy extraño. ¿Por qué afirman que el tamaño del efecto puede calcularse exactamente igual que para la prueba de muestras independientes (Mann-Whitney)? Me parece incorrecto.
0 votos
$X$ , $Y$ y $Z$ sólo reflejan los rangos. Sin embargo, los rangos son "artificiales". Las estadísticas se interpretan en función de la observación, no de las clasificaciones. Por lo tanto, los cálculos de potencia o IC en términos de algún modelo de localización, que traduce el tamaño del efecto "natural" al mundo estadístico de los rangos, tienen sentido. Así que no estoy seguro de que los procedimientos de esta pregunta sean realmente útiles.
0 votos
@HorstGrünbusch Utilizo el estimador de Hodges-Lehmann para calcular el tamaño del efecto, pero quiero informar de una medida más tradicional junto a él, como la correlación de Spearman (los datos son ordinales y la distribución desconocida pero no normal). Me he topado con la primera fórmula y sólo quiero entenderla. Como puedes ver en mi otra pregunta, ni siquiera entiendo qué es esa Z.
0 votos
El pseudomediano de Hodges-Lehmann no es una medida estandarizada. El tamaño del efecto, por definición, debe ser una medida estandarizada.
0 votos
Entonces, ¿qué es ¿una medida normalizada apropiada para los datos ordinales y no ordinales, y por qué (fuente)?
1 votos
Personalmente pensé que Z/sqrt(n) podría ser una opción. Wikipedia en Mann-Whitney enlaces a un documento pdf por Kirby que considera Wilcoxon emparejado también; No he leído el artículo yo mismo.
0 votos
Cuando Wilcoxon es una prueba pareada, sólo hay una $n$ . Al hacer Wilcoxon-Mann-Whitney, hay dos muestras independientes con diferentes $n$ 's.
0 votos
@Carl ¿a qué te refieres con un n, quieres decir que la fórmula es Z/sqrt(n+n)?
0 votos
@¿Puedes proporcionar referencias para las que los autores sugieran utilizar el coeficiente de Bravais-Pearson o el de Spearman para el tamaño del efecto? Gracias.
0 votos
@RockTheStar Lo siento, esta pregunta es de hace año y medio, no recuerdo lo que leía entonces.
1 votos
@RockTheStar Las imágenes de arriba corresponden al Prueba de rango con signo de Wilcoxon y la pregunta que precede parece una variación de la pregunta Prueba de suma de rangos de Wilcoxon prueba de Mann-Whitney, $\rho$ estadística.
1 votos
@RockTheStar Mira aquí: es.wikipedia.org/wiki/Tamaño_del_efecto y aquí: stats.stackexchange.com/questions/15749/ Ambos discuten el coeficiente de correlación como medida del tamaño del efecto.
0 votos
@what, interesante. Hmm ... así que ¿cuál es el tamaño del efecto medio por defecto para wilcoxon? He visto 0,3 o 0,5