Tengo dos conjuntos de datos y me gustaría tener una métrica que diga algo sobre CÓMO de diferentes son los conjuntos. Utilizo la medida d de Cohen. Digamos que d=0,5 pero p=0,32. ¿Qué significa esto?
Respuesta
¿Demasiados anuncios?Mi respuesta supone pruebas t de dos muestras no apareadas (suponiendo igual varianza) . Los ajustes son los siguientes;
- El tamaño de la muestra, la media y la desviación típica del grupo A son
$n_a$ , $m_a$ , $sd_a$ y - El tamaño de la muestra, la media y la desviación típica del grupo B son
$n_b$ , $m_b$ , $sd_b$ respectivamente.
La desviación típica se calcula mediante la fórmula método n-1 .
Dados estos datos, puedes calcular los valores t y d y p.
【Comprensión visual utilizando Excel】.
Puede sentir la relación entre el valor p y el valor d introduciendo varios $n_a$ , $m_a$ , $sd_a$ , $n_b$ , $m_b$ , $sd_b$ en el siguiente archivo Excel; Descargar CalculadoraTamañoEfecto.xls de ici
El siguiente ejemplo dará una respuesta visual a su pregunta;
Aquí, el valor p aparece en la columna K y el valor d en la columna N.
【Explicación matemática; la relación entre los valores t y d】
Utiliza sólo álgebra elemental para definir los valores t y d. Si comparas las definiciones de valor t y valor d, entenderás por qué y cómo.
[Preparación]
Ahora, defina $degf$ y $sd_p$ que ayudan a definir d y t.
$$degf := n_a + n_b -2 \tag{1}$$ $$sd_p:=\sqrt{\frac{({n_a}-1)*{sd_a} + ({n_b}-1)*{sd_b}}{degf}} \tag{2}$$
[Cohen's d]
Mucha gente utiliza la "d de Cohen", definida en la siguiente ecuación en este problema. Por lo tanto, adoptamos la siguiente definición.
$$d:=\frac{|m_a - m_b|}{sd_p} \tag{3}$$
Desgraciadamente, aquí hay confusión sobre la definición de la d de Cohen; diferentes tamaños del efecto se denominan con el mismo nombre, "d de Cohen". Véase esto enlace para más información sobre esta desafortunada confusión.
[Estudiante t]
Por otra parte, en esencia sólo existe una definición de valor t adecuada para este problema. Un libro de texto típico tendría la siguiente definición:
$$t := \frac{|{m_a} - {m_b}|}{{sd_p} \cdot \sqrt{\frac{1}{n_a}+\frac{1}{n_b}}} \tag{4}$$
[Relación entre los valores t y d]
El valor t de la fórmula (4) puede transformarse como sigue; $$t = \frac{|{m_a} - {m_b}|}{sd_p}\sqrt{\frac{{n_a}*{n_b}}{{n_a}+{n_b}}}=d\sqrt{N_{tot}} \tag{5}$$
Toma, $${N_{tot}} :=\frac{{n_a}*{n_b}}{{n_a}+{n_b }} \tag{6}$$
Así, el valor t se separó en términos de "tamaño del efecto" y "términos que dependen sólo del tamaño de la muestra".
【Conclusion】
Mira la ecuación 5 y todas tus preguntas quedarán claras, al menos para este problema. Otra vez, $$t = d\sqrt{N_{tot}} . \tag{5'}$$
Como sabe, cuanto mayor sea el valor t, menor será el valor p. Por lo tanto, puede aumentar el valor p aumentando el tamaño del efecto o aumentando $N_{tot} $ .
Por el contrario, si ${N_{tot}}$ se hace más pequeño, t se hace más pequeño y el valor p se hace más grande.
Nota:
La explicación matemática para convertir un valor t en un valor p es un poco difícil. Pero es fácil con Excel. La fórmula para convertir el valor t en valor p se describe en el archivo Excel anterior. Si hay $degf$ y el valor t, el valor p puede obtenerse mediante TDIST de Excel.
P.D. No se me da muy bien el inglés, así que siento si tengo expresiones descorteses o poco claras. Agradezco cualquier corrección y revisión del inglés. (Puedes editar mi pregunta y descripción para mejorarlas).