Pruebas de significación de las correlaciones
Existen pruebas de significación estadística que pueden aplicarse a las correlaciones individuales, que indican la probabilidad de obtener una correlación tan grande o mayor que la correlación de la muestra suponiendo que la hipótesis nula sea cierta.
El punto clave es que lo que constituye un coeficiente de correlación estadísticamente significativo depende de:
- Tamaño de la muestra : Una muestra de mayor tamaño conducirá a umbrales más pequeños
- alfa El valor de los alfas: a menudo se fija en 0,05, pero los alfas más pequeños conducen a umbrales más altos de significación estadística.
- prueba de una cola / de dos colas : Supongo que usted utilizaría dos colas, así que esto probablemente no importa
- tipo de coeficiente de correlación : Supongo que estás usando el sistema de Pearson
- hipótesis de distribución de x e y
En circunstancias comunes, en las que el alfa es de 0,05, utilizando una prueba de dos colas, con la correlación de Pearson, y en las que la normalidad es al menos una aproximación adecuada, el principal factor que influye en el corte es el tamaño de la muestra.
Umbral de importancia
Otra forma de interpretar su pregunta es considerar que no le interesa saber si una correlación es estadísticamente significativa, sino si es prácticamente importante.
Algunos investigadores han ofrecido reglas empíricas para interpretar el significado de los coeficientes de correlación, pero estas reglas empíricas son específicas del ámbito.
Pruebas de significación múltiple
Sin embargo, como lo que le interesa es marcar correlaciones significativas en una matriz, esto cambia el contexto inferencial. Usted tiene $k(k-1)/2$ correlaciones donde $k$ es el número de variables (es decir $14(13)/2=91$ . Si la hipótesis nula fuera cierta para todas las correlaciones de la matriz, cuantas más pruebas de significación se realicen, más probabilidades habrá de cometer un error de tipo I. Por ejemplo, en su caso, usted cometería de media $91 * .05 = 4.55$ Errores de tipo I si la hipótesis nula fuera cierta para todas las correlaciones.
Como ha señalado @user603, estas cuestiones fueron bien discutidas en este pregunta anterior .
En general, me parece útil, al interpretar una matriz de correlación, centrarse en la estructura de nivel superior. Esto puede hacerse de manera informal, observando los patrones generales de la matriz de correlación. También puede hacerse de manera más formal utilizando técnicas como el ACP y el análisis factorial. Estos enfoques evitan muchos de los problemas asociados a las pruebas de significación múltiple.
1 votos
¿has comprobado stats.stackexchange.com/questions/5750/ ?
0 votos
@usuario603 Buena captura: es prácticamente la misma pregunta. La novedad aquí es preguntar si las pruebas de correlación significativa podrían depender del "tipo de datos" (léase: distribución de los datos). Esperemos que las respuestas se centren en este aspecto en lugar de repasar el viejo terreno.