He realizado un clustering en 20K genes, y quiero entender cómo de coherentes son los clusters resultantes calculando la importancia del solapamiento de los clusters con una serie de categorías de genes GO conocidas. Para ello utilizo valores p hipergeométricos, y también quiero corregir las pruebas múltiples utilizando la corrección de Bonferroni. Mi pregunta es sobre cómo realizar la corrección de Bonferroni. Sé que tengo que multiplicar cada valor p hipergeométrico por el número de experimentos realizados para calcular los valores p, pero estoy un poco confuso sobre lo que significa "el número de experimentos". Intuyo que, en mi caso, el número por el que tengo que multiplicar cada valor p hipergeométrico es #clusters * #GO-categories
¿es así? Así, por ejemplo, si estoy comprobando el enriquecimiento de cada uno de los 100 clusters con cada una de las 200 categorías de genes, multiplicaré el valor p de cada par cluster-categoría por 20000. ¿Podría confirmarlo? Gracias.